Score Z

Description

Le score Z, ou score standard, est un moyen de décrire un point de données selon sa relation avec la moyenne et l'écart-type d'un groupe de points. L'établissement du score Z revient simplement à représenter les données dans une distribution dont la moyenne est définie sur 0 et dont l'écart-type est défini sur 1.

L'objectif du score Z est d'éliminer les effets de localisation et d'échelle des données, ce qui permet de comparer directement des ensembles de données différents. L'idée derrière la méthode de score Z pour détecter les valeurs aberrantes est qu'une fois que vous avez centré et remis à l'échelle les données, toute valeur trop éloignée de zéro (le seuil est généralement un score Z de 3 ou -3) est considérée comme aberrante.

En supposant une distribution normale des données (courbe en cloche), la formule "moyenne + 3*écart-type" capture 99,7 % des observations. Statistiquement, toute valeur qui se trouve en dehors de cette plage est considérée comme une anomalie.


Exemple de score Z