Z 점수

설명

Z 점수 또는 표준 점수는 포인트 그룹의 평균 및 표준 편차에 대한 관계 측면에서 데이터 포인트를 설명하는 방법입니다. Z 점수를 사용하는 경우 단순히 평균이 0으로 정의되고 표준 편차가 1로 정의된 분포에 데이터를 매핑하면 됩니다.

Z 점수를 사용하는 목표는 데이터의 위치 및 스케일 효과를 제거하여 서로 다른 데이터 세트를 직접 비교할 수 있게 하는 것입니다. Z 점수를 사용한 이상치 감지 방법은 데이터를 중심에 집중하고 스케일을 조정한 후 0에서 너무 떨어진 항목(임계값은 일반적으로 Z 점수 3 또는 -3)은 이상치로 간주되어야 한다는 직관에서 나온 것입니다.

데이터가 정규 분포(벨 모양 곡선)되었다고 가정할 경우 평균 + 3*SD(표준 편차)는 관찰의 99.7%를 캡처합니다. 통계상, 이 범위를 벗어난 모든 값은 변칙으로 간주됩니다.


Zscore 예제