데이터 준비

예측을 수행하기 전에 데이터 평가 및 관리 방법(예: 이상치 또는 누락된 값 처리 방법)을 정의합니다. 이러한 데이터 준비 옵션은 예측에 사용되는 데이터의 품질을 향상시킬 수 있습니다.

각 동인에 대한 데이터를 관리하는 방법을 정의합니다. 타겟는 예측 중인 타겟 측정항목을 나타냅니다.

  1. 미래 입력 동인 데이터의 경우 입력 동인 값이 누락된 값을 예측하려면 누락된 입력 동인 값 예측을 선택합니다.

    누락된 값은 통계 예측(단변량 예측)을 사용하여 예측되며 ML 모델 학습에 사용됩니다.

  2. 각 동인에 대해 누락된 값을 처리하는 방법을 정의합니다. 작업 열에서 편집 아이콘(편집 아이콘)을 누른 다음 누락된 값 목록에서 동인에 대해 누락된 값을 처리하는 옵션을 선택합니다.

    측정 실패, 형식 지정 문제, 인적 오류 또는 정보 부족과 같은 여러 가지 이유로 누락된 값이 데이터에 포함될 수 있습니다. 이러한 누락된 값을 채우는 방법을 정의하여 데이터 세트의 누락된 항목에 표준화된 값을 추가합니다.

    • 없음 - 아무 작업도 수행하지 않고 그대로 데이터를 전송합니다.
    • 0 - 모든 열의 누락된 값을 0으로 바꿉니다.
    • 평균으로 바꾸기 - 과거 계열의 평균으로 바꿉니다.
    • 중앙값으로 바꾸기 - 과거 계열의 중앙값으로 바꿉니다.
    • 모드로 바꾸기 - 과거 데이터의 가장 일반적인 값으로 바꿉니다.
    • 다음 관찰 값으로 바꾸기 - 누락된 값을 다음 기간에 관찰된 값으로 바꿉니다.
    • 마지막 관찰 값으로 바꾸기 - 누락된 값을 이전 기간에 관찰된 값으로 바꿉니다.
  3. 각 동인의 이상치 목록에서 이상치 값을 처리하는 데 사용할 옵션을 선택합니다. 이상치 값은 동인의 mean +/- 3*Standard Deviation 범위를 벗어나는 값입니다.
    • 없음 - 아무 작업도 수행하지 않고 그대로 데이터를 전송합니다.

    • 0으로 바꾸기 - 0으로 바꿉니다.

    • 평균으로 바꾸기 - 평균으로 바꿉니다.

    • Z_score로 바꾸기 - z_score로 바꿉니다.

      숫자 열의 경우 mean +/- 3*Standard Deviation(std dev)에서 벗어나는 값은 이상치로 처리됩니다. mean - 3*std dev 미만인 값은 mean -3*std dev로 바뀝니다. mean + 3*std dev를 초과하는 값은 mean + 3*std dev로 바뀝니다.

  4. 다음을 누릅니다.