準備資料

定義如何在執行預測前評估和管理資料,例如,如何處理異常值或無資料值。這些資料準備選項可改善用於預測的資料品質。

請定義要如何管理每個動因的資料。請注意,目標值為表示正在預測的目標測量值。

  1. 針對未來的輸入動因資料,如果您想要預測遺漏輸入動因值的值,請選取預測遺漏輸入動因值

    預測無資料值時,會使用統計預測 (單變量預測) 來預測,且這些值會用於 ML 模型訓練。

  2. 針對每個動因,定義如何處理無資料值:按一下動作欄中的「編輯」圖示 「編輯」圖示,然後從無資料值清單中,選取處理無動因值的選項。

    資料可能因數種原因而包含無資料值,例如測量失敗、格式問題、人為錯誤或缺乏資訊。您可以定義填入這些無資料值的方式,這可將標準化的值新增至資料集內的無資料項目。

    • — 不採取任何動作並依原樣傳送資料。
    • — 以零取代任何欄的無資料值。
    • 以平均值取代 — 以歷史序列的平均值取代。
    • 以中位數取代 — 以歷史序列的中位數點取代。
    • 以眾數取代 — 以歷史資料中最常見的值取代。
    • 以下一個觀察值取代 — 以下一個期間觀察到的值取代無資料值。
    • 以上一個觀察值取代 — 以上一個期間觀察到的值取代無資料值。
  3. 針對每個動因,從異常值清單中,選取要用來處理異常值 (任何不在動因範圍 mean +/- 3*Standard Deviation 內的值) 的選項:
    • — 不採取任何動作並依原樣傳送資料。

    • 以零取代 — 以零取代。

    • 以平均值取代 — 以平均值取代。

    • 以 Z_score 取代 — 以 Z_score 取代。

      針對任何數值欄,任何不在 mean +/- 3*Standard Deviation (標準偏差) 範圍內的值都會被視為異常值。小於 mean - 3*std dev 的值會被 mean -3*std dev 取代。大於 mean + 3*std dev 會被 mean + 3*std dev 取代。

  4. 按一下下一步