IQR (Rango intercuartílico)

IQR es otro método sólido para etiquetar los valores atípicos. El método IQR (rango intercuartílico) de la detección de valores atípicos fue desarrollado por John Tukey, pionero del análisis de datos de exploración. Esto ocurría cuando el cálculo y trazado se realizaba a mano, con conjuntos de datos normalmente pequeños y en los que el énfasis estaba en entender la historia que contaban los datos.

Un diagrama de caja y bigotes usa los cuartiles (puntos que dividen los datos en cuatro grupos del mismo tamaño) para trazar la forma de los datos. El cuadro representa los cuartiles primero y tercero, que son iguales a los percentiles 2 y 75. La línea del interior del cuadro representa el segundo cuartil, que es la mediana.

El rango intercuartílico, que da nombre a este método de detección de valores atípicos, es el rango entre el primer y el tercer cuartil (los bordes de la caja). Tukey pensó que cualquier punto de datos que quedara fuera de o bien 1,5 veces el IQR por debajo del primer cuartil, o 1,5 veces el IQR por encima del tercer cuartil, estaría fuera o sería lejano. En un diagrama de caja y bigotes, los bigotes se amplían hasta el último punto de datos que no quede fuera.

El rango intercuartílico (IQR) es una medida de variabilidad, basada en la división de un conjunto de datos en cuartiles. Los cuartiles dividen un conjunto de datos clasificados en cuatro partes iguales. T1, T2 y T3. IQR se define como Q3–Q1, y los datos que quedan fuera de Q3+1,5*IQR o de Q1-1,5*IQR se consideran valores atípicos.


Ejemplo de IQR