Puntuación Z

Descripción

La puntuación Z, o puntuación estándar, es un método para describir un punto de datos en su relación con la desviación media y estándar de un grupo de puntos. Tomar una puntuación Z es simplemente asignar los datos en una distribución cuya media se defina como 0 y cuya desviación estándar se defina como 1.

El objetivo de tomar puntuaciones Z es eliminar los efectos de la ubicación y la escala de los datos, lo que permite la comparación directa de distintos juegos de datos. La intuición que subyace en el método de puntuación Z de la detección de valores atípicos es que, una vez que hemos centrado y reajustado los datos, cualquier valor que esté demasiado alejado de cero (el umbral suele ser una puntuación Z de 3 o -3) se debe considerar un valor atípico.

Asumiendo que los datos tienen una distribución normal (curva con forma de campana), Media + 3*DE (Desviación estándar) capturará el 99,7 % de las observaciones. Desde el punto de vista estadístico, cualquier valor que quede fuera de este rango se considera una anomalía.


Ejemplo de puntuación Z