Z-Score

Beschreibung

Der Z-Score, auch Standard-Score genannt, stellt eine Möglichkeit dar, einen Datenpunkt in Bezug auf seine Beziehung zur mittleren Abweichung und zur Standardabweichung einer Gruppe von Punkten zu beschreiben. Die Verwendung eines Z-Score bedeutet einfach, die Daten einer Verteilung zuzuordnen, deren mittlere Abweichung als 0 und deren Standardabweichung als 1 definiert ist.

Das Ziel bei der Verwendung von Z-Scores besteht darin, die Auswirkungen von Position und Maßstab der Daten zu beseitigen, sodass unterschiedliche Datasets direkt verglichen werden können. Die Idee hinter der Z-Score-Methode zur Erkennung von Ausreißern lautet wie folgt: Sobald wir die Daten zentriert und neu skaliert haben, gelten alle Werte, die weit von 0 entfernt sind (der Schwellenwert ist in der Regel ein Z-Score von 3 oder -3), als Ausreißer.

Wenn wir davon ausgehen, dass die Datenverteilung normal ist (Glockenkurve), werden mit "Mittelwert + 3*SD" (Standardabweichung) 99,7 % der Beobachtungen erfasst. Statistisch gilt jeder Wert, der außerhalb dieses Bereichs liegt, als Anomalie.


Beispiel für Z-Score