Opérateur de prévision d'intelligence artificielle

L'opérateur de prévision de l'intelligence artificielle utilise les données historiques de séries chronologiques pour générer des prévisions pour les tendances futures.

Cet opérateur simplifie et accélère le processus de science des données en automatisant la sélection des modèles, le réglage des hyperparamètres et l'identification des fonctions pour une tâche de prédiction spécifique.

L'opérateur est facile à utiliser et à étendre, et aussi puissant qu'une équipe de spécialistes des données. Pour commencer à utiliser une prévision, utilisez la configuration YAML suivante :
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
    horizon: 3
    target_column: y

Cet exemple est présenté de différentes manières dans cette documentation. Cependant, tous les paramètres au-delà de ceux indiqués sont facultatifs.

Pour plus d'informations, consultez la section Prévisions de la documentation relative à ADS.

Options de modélisation

Il n'existe pas de modèle parfait. Une caractéristique principale de l'opérateur est la possibilité de choisir parmi divers cadres de modèle. Pour l'IA d'entreprise, généralement un ou deux cadres offrent les meilleures performances pour l'espace problématique. Chaque modèle est optimisé pour différentes hypothèses, telles que la taille, la fréquence, la complexité et la saisonnalité des jeux de données. La meilleure façon de décider quel cadre est correct pour vous est par des tests empiriques. Basée sur l'expérience de plusieurs problèmes de prévision d'entreprise, l'équipe ADS a trouvé les cadres suivants les plus efficaces, allant des modèles statistiques traditionnels à l'apprentissage automatique complexe et aux réseaux neuronaux profonds :
  • Prophète
  • ARMMI
  • LightGBM
  • NeuralProphet
  • AutoTS
Note

AutoTS n'est pas un cadre de modélisation unique, mais une combinaison de plusieurs. AutoTS algorithms include (v0.6.15): ConstantNaive, LastValueNaive, AverageValueNaive, GLS, GLM, ETS, ARIMA, FBProphet, RollingRegression, GluonTS, SeasonalNaive, UnobservedComponents, VECM, DynamicFactor, MotifSimulation, WindowRegression, VAR, DatepartRegression, UnivariateRegression, UnivariateMotif, MultivariateMotif, NVAR, MultivariateRegression, SectionalMotif, Theta, ARDL, NeuralProphet, DynamicFactorMQ, PytorchForecasting, ARCH, RRVAR, MAR, TMF, LATC, KalmanStateSpace, MetricMotif, Cassandra, SeasonalityMotif, MLEnsemble, PreprocessingRegression, FFT, BallTreeMultivariateMotif, TiDE, NeuralForecast, DMD.

Sélection automatique

Pour les nouveaux utilisateurs de la prévision, l'opérateur dispose également d'une option de sélection automatique. Il s'agit de l'option la plus coûteuse du point de vue des calculs, car elle divise les données d'entraînement en plusieurs ensembles de validation, évalue chaque structure et tente de déterminer la meilleure. Toutefois, la sélection automatique ne garantit pas la recherche du meilleur modèle et n'est pas recommandée en tant que configuration par défaut pour les utilisateurs finaux en raison de sa complexité.

Spécifier le modèle

Vous pouvez sélectionner manuellement le modèle requis dans la liste des options de modélisation et l'insérer dans l'emplacement des paramètres du modèle. Par exemple :
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
    horizon: 3
    model: <INSERT_MODEL_NAME_HERE>
    target_column: y

Évaluation et explication

En tant que solution d'IA d'entreprise, l'opérateur s'assure que l'évaluation et l'explication des prévisions sont aussi critiques que les prévisions elles-mêmes.

Production de rapports

À chaque exécution d'opérateur, un rapport est généré pour résumer le travail effectué. Le rapport comprend les éléments suivants :
  • Sommaire des données d'entrée.
  • Visualisation de la prévision.
  • Une liste des grandes tendances.
  • Explication (à l'aide des valeurs SHAP) des fonctions supplémentaires.
  • Table de mesures.
  • Copie du fichier de configuration YAML.

Mesures

Les différents cas d'utilisation sont optimisés pour différentes mesures. L'opérateur permet aux utilisateurs de spécifier la mesure à optimiser à partir de la liste suivante :
  • PEAM
  • EMQ
  • SMAPE
  • ESP
Facultativement, la mesure peut être spécifiée dans le fichier YAML :
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
    horizon: 3
    model: prophet
    target_column: y
    metric: rmse

Description

Lorsque des données supplémentaires sont fournies, l'opérateur peut éventuellement générer des explications pour ces fonctions (colonnes) à l'aide de valeurs SHAP. Vous pouvez activer les explications dans le fichier YAML :
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_pedestrians_covid.csv
    additional_data:
        url: additional_data.csv
    horizon: 3
    model: prophet
    target_column: y
    generate_explanations: True
``` formatted YAML ```
Avec les jeux de données volumineux, la génération de valeurs SHAP peut s'avérer onéreuse. Les applications d'entreprise peuvent varier dans leur besoin de précision décimale par rapport au coût de calcul. Par conséquent, l'opérateur offre plusieurs options :
FAST_APPROXIMATE (par défaut)
Les valeurs SHAP générées sont généralement comprises dans 1 % des valeurs vraies et nécessitent 1 % du temps.
ÉQUILIBRÉ
Les valeurs SHAP générées sont généralement comprises dans 0,1 % des valeurs vraies et nécessitent 10 % du temps.
HIGH_ACCURACY
Génère les vraies valeurs SHAP avec une précision totale.
kind: operator
type: forecast
version: v1
spec:
    datetime_column:
        name: ds
    historical_data:
        url: https://raw.githubusercontent.com/facebook/prophet/main/examples/example_yosemite_temps.csv
    horizon: 3
    model: prophet
    target_column: y
    generate_explanations: True
    explanations_accuracy_mode: BALANCED
La sélection du meilleur mode de précision nécessite des tests empiriques, mais FAST_APPROXIMATE est le plus souvent suffisant pour les données du monde réel.
Note

L'exemple précédent ne génère pas d'explications en raison de l'absence de données supplémentaires. Les valeurs SHAP sont 100 % pour la fonction y.