Daten vorbereiten

Definieren Sie, wie die Daten bewertet und verwaltet werden sollen, bevor Sie die Vorhersage ausführen, z.B. wie Ausreißer oder fehlende Werte behandelt werden sollen. Diese Optionen zur Vorbereitung der Daten können die Qualität der für die Vorhersage verwendeten Daten verbessern.

Definieren Sie, wie die Daten für jeden Treiber verwaltet werden. Beachten Sie, dass der Zielwert Ja die Zielkennzahl angibt, die vorhergesagt wird.

  1. Wählen Sie für zukünftige Eingabetreiberdaten die Option Fehlende Eingabetreiberwerte vorhersagen aus, wenn Sie Werte vorhersagen möchten, bei denen Eingabetreiberwerte fehlen.

    Fehlende Werte werden anhand statistischer Prognosen (univariate Vorhersagen) vorhergesagt und für das ML-Modelltraining verwendet.

  2. Definieren Sie für jeden Treiber, wie fehlende Werte behandelt werden sollen: Klicken Sie in der Spalte Aktionen auf das Symbol "Bearbeiten" Symbol "Bearbeiten", und wählen Sie dann in der Liste Fehlende Werte eine Option zur Behandlung fehlender Werte für den Treiber aus.

    Daten können aus verschiedenen Gründen fehlende Werte enthalten, z.B. Messfehler, Formatierungsprobleme, menschliche Fehler oder fehlende Informationen. Definieren Sie, wie diese fehlenden Werte ausgefüllt werden. Dadurch werden den fehlenden Einträgen im Datenset standardisierte Werte hinzugefügt.

    • Keine - Keine Aktion ausführen und die Daten unverändert senden.
    • Null - Fehlende Werte für jede Spalte durch Null ersetzen.
    • Durch Mittelwert ersetzen - Durch den Mittelwert der gesamten historischen Reihe ersetzen.
    • Durch Median ersetzen - Durch den Medianpunkt der historischen Reihe ersetzen.
    • Durch Modus ersetzen - Durch den am häufigsten verwendeten Wert in den historischen Daten ersetzen.
    • Durch nächsten beobachteten Wert ersetzen - Fehlende Werte durch den in der nächsten Periode beobachteten Wert ersetzen.
    • Durch zuletzt beobachteten Wert ersetzen - Fehlende Werte durch den in der vorherigen Periode beobachteten Wert ersetzen.
  3. Wählen Sie für jeden Treiber in der Liste Ausreißer eine Option aus, mit der Ausreißerwerte verarbeitet werden sollen. Dabei handelt es sich um Werte, die außerhalb des Bereichs mean +/- 3*Standard Deviation für den Treiber liegen:
    • Keine - Keine Aktion ausführen und die Daten unverändert senden.

    • Durch Null ersetzen - Durch Null ersetzen.

    • Durch Mittelwert ersetzen - Durch den Mittelwert ersetzen.

    • Durch z_score ersetzen - Durch z_score ersetzen.

      Für jede numerische Spalte wird jeder Wert aus mean +/- 3*Standard Deviation (std dev) als Ausreißer behandelt. Ein Wert unter mean - 3*std dev wird durch mean -3*std dev ersetzt. Ein Wert größer als mean + 3*std dev wird durch mean + 3*std dev ersetzt.

  4. Klicken Sie auf Weiter.