Definieren Sie, wie die Daten bewertet und verwaltet werden sollen, bevor Sie die Vorhersage ausführen, z.B. wie Ausreißer oder fehlende Werte behandelt werden sollen. Diese Optionen zur Vorbereitung der Daten können die Qualität der für die Vorhersage verwendeten Daten verbessern.
Definieren Sie, wie die Daten für jeden Treiber verwaltet werden. Beachten Sie, dass der Zielwert Ja die Zielkennzahl angibt, die vorhergesagt wird.
Fehlende Werte werden anhand statistischer Prognosen (univariate Vorhersagen) vorhergesagt und für das ML-Modelltraining verwendet.
Daten können aus verschiedenen Gründen fehlende Werte enthalten, z.B. Messfehler, Formatierungsprobleme, menschliche Fehler oder fehlende Informationen. Definieren Sie, wie diese fehlenden Werte ausgefüllt werden. Dadurch werden den fehlenden Einträgen im Datenset standardisierte Werte hinzugefügt.
mean +/- 3*Standard Deviation für den Treiber liegen:
Keine - Keine Aktion ausführen und die Daten unverändert senden.
Durch Null ersetzen - Durch Null ersetzen.
Durch Mittelwert ersetzen - Durch den Mittelwert ersetzen.
Durch z_score ersetzen - Durch z_score ersetzen.
Für jede numerische Spalte wird jeder Wert aus mean +/- 3*Standard Deviation (std dev) als Ausreißer behandelt. Ein Wert unter mean - 3*std dev wird durch mean -3*std dev ersetzt. Ein Wert größer als mean + 3*std dev wird durch mean + 3*std dev ersetzt.