定義如何在執行預測前評估和管理資料,例如,如何處理異常值或無資料值。這些資料準備選項可改善用於預測的資料品質。
請定義要如何管理每個動因的資料。請注意,目標值為是表示正在預測的目標測量值。
預測無資料值時,會使用統計預測 (單變量預測) 來預測,且這些值會用於 ML 模型訓練。
資料可能因數種原因而包含無資料值,例如測量失敗、格式問題、人為錯誤或缺乏資訊。您可以定義填入這些無資料值的方式,這可將標準化的值新增至資料集內的無資料項目。
mean +/- 3*Standard Deviation 內的值) 的選項:
無 — 不採取任何動作並依原樣傳送資料。
以零取代 — 以零取代。
以平均值取代 — 以平均值取代。
以 Z_score 取代 — 以 Z_score 取代。
針對任何數值欄,任何不在 mean +/- 3*Standard Deviation (標準偏差) 範圍內的值都會被視為異常值。小於 mean - 3*std dev 的值會被 mean -3*std dev 取代。大於 mean + 3*std dev 會被 mean + 3*std dev 取代。