Préparation des données

Déterminez comment évaluer et gérer les données avant d'effectuer la prévision. Par exemple, définissez la gestion des valeurs aberrantes ou manquantes. Ces options de préparation des données peuvent améliorer la qualité des données utilisées pour la prévision.

Définissez le mode de gestion des données pour chaque inducteur. La valeur Cible Oui indique la mesure cible prévue.

  1. Pour les données d'inducteur d'entrée futures, sélectionnez Prévoir les valeurs d'inducteur d'entrée manquantes si vous voulez prévoir des valeurs lorsque les valeurs d'inducteur d'entrée sont manquantes.

    Les valeurs manquantes sont prévues à l'aide de prévisions statistiques (prévisions à une variable) et utilisées pour l'entraînement de modèle d'apprentissage automatique.

  2. Pour chaque inducteur, définissez le mode de gestion des valeurs manquantes : cliquez sur l'icône Modifier Icône Modifier dans la colonne Actions, puis, dans la liste Valeurs manquantes, sélectionnez une option de gestion des valeurs manquantes pour le pilote.

    Les données peuvent contenir des valeurs manquantes pour plusieurs raisons : échecs de mesure, problèmes de formatage, erreurs humaines, manque d'informations, etc. Vous déterminez comment remplacer ces valeurs manquantes, ce qui ajoute des valeurs standardisées aux entrées manquantes dans l'ensemble de données.

    • Aucun : n'effectuer aucune action et envoyer les données telles quelles.
    • Zéro : remplacer les valeurs manquantes dans une colonne par zéro.
    • Remplacer par la moyenne : remplacer par la moyenne de la série historique.
    • Remplacer par la médiane : remplacer par le point médian de la série historique.
    • Remplacer par le mode : remplacer par la valeur la plus courante dans les données historiques.
    • Remplacer par la valeur observée suivante : remplacer les valeurs manquantes par la valeur observée au cours de la période suivante.
    • Remplacer par la dernière valeur observée : remplacer les valeurs manquantes par la valeur observée au cours de la période précédente.
  3. Pour chaque inducteur, dans la liste Valeurs aberrantes, sélectionnez une option à utiliser pour gérer les valeurs aberrantes, qui sont les valeurs hors de la plage moyenne +/- 3*écart-type pour l'inducteur :
    • Aucun : n'effectuer aucune action et envoyer les données telles quelles.

    • Remplacer par zéro : remplacer par zéro.

    • Remplacer par la moyenne : remplacer par la moyenne.

    • Remplacer par le score Z : remplacer par le score Z.

      Pour une colonne numérique, toute valeur hors de la plage moyenne +/- 3*écart-type est traitée comme une valeur aberrante. Une valeur inférieure à moyenne - 3*écart-type est remplacée par moyenne -3*écart-type. Une valeur supérieure à moyenne + 3*écart-type est remplacée par moyenne + 3*écart-type.

  4. Cliquez sur Suivant.