IQR(사분위수 범위)

IQR은 이상치에 레이블을 지정하는 다른 강력한 방법입니다. IQR(사분위수 범위) 이상치 감지 방법은 탐색 데이터 분석의 선구자인 John Tukey가 개발한 것입니다. 이 방법은 수동으로 계산하고 그래프를 그렸던 시대에 사용되었으므로 관련 데이터 세트가 일반적으로 작았으며, 데이터 내용을 파악하는 데 중점을 두었습니다.

상자 수염 그림은 사분위수(데이터를 동일한 크기의 4개 그룹으로 나누는 지점)를 사용하여 데이터 모양을 그립니다. 상자는 제1 사분위수와 제3 사분위수를 나타내며, 제25 및 제75 백분위수와 같습니다. 상자 내부 선은 제2 사분위수(중앙값)를 나타냅니다.

이 이상치 감지 방법의 이름으로 사용되는 사분위수 범위는 제1 사분위수와 제3 사분위수(상자 가장자리) 사이의 범위입니다. Tukey는 제1 사분위수 아래 IQR의 1.5배 또는 제3 사분위수 위 IQR의 1.5배 범위를 벗어난 데이터 포인트를 외부에 있거나 너무 멀리 떨어진 것으로 간주했습니다. 클래식 상자 수염 그림에서 수염은 외부가 아닌 마지막 데이터 포인트까지 확장됩니다.

IQR(사분위수 범위)은 데이터 세트를 사분위수로 나누어 표시 여부를 측정한 것입니다. 사분위수는 순위가 매겨진 데이터 세트를 4개의 동일한 부분으로 나눕니다. Q1, Q2, Q3. IQR은 Q3-Q1로 정의되며, Q3+1.5*IQR 또는 Q1-1.5*IQR 이외의 모든 데이터는 이상치로 간주됩니다.


IQR 예제