Déterminez comment évaluer et gérer les données avant d'effectuer la prévision. Par exemple, définissez la gestion des valeurs aberrantes ou manquantes. Ces options de préparation des données peuvent améliorer la qualité des données utilisées pour la prévision.
Définissez le mode de gestion des données pour chaque inducteur. La valeur Cible Oui indique la mesure cible prévue.
Les valeurs manquantes sont prévues à l'aide de prévisions statistiques (prévisions à une variable) et utilisées pour l'entraînement de modèle d'apprentissage automatique.
Les données peuvent contenir des valeurs manquantes pour plusieurs raisons : échecs de mesure, problèmes de formatage, erreurs humaines, manque d'informations, etc. Vous déterminez comment remplacer ces valeurs manquantes, ce qui ajoute des valeurs standardisées aux entrées manquantes dans l'ensemble de données.
moyenne +/- 3*écart-type pour l'inducteur :
Aucun : n'effectuer aucune action et envoyer les données telles quelles.
Remplacer par zéro : remplacer par zéro.
Remplacer par la moyenne : remplacer par la moyenne.
Remplacer par le score Z : remplacer par le score Z.
Pour une colonne numérique, toute valeur hors de la plage moyenne +/- 3*écart-type est traitée comme une valeur aberrante. Une valeur inférieure à moyenne - 3*écart-type est remplacée par moyenne -3*écart-type. Une valeur supérieure à moyenne + 3*écart-type est remplacée par moyenne + 3*écart-type.