IQR (Interquartilsabstand)

IQR stellt eine andere stabile Methode zur Kennzeichnung von Ausreißern dar. Die IQR-Methode (Interquartilsabstand) zur Erkennung von Ausreißern wurde von John Tukey, dem Pionier der explorativen Datenanalyse, entwickelt. Zu jener Zeit erfolgten Berechnung und Darstellung von Hand. Die beteiligten Datasets waren also in der Regel klein, und der Schwerpunkt lag darauf zu verstehen, wie die Daten zustande gekommen waren.

Bei einem Box- und Whisker-Plot werden Quartile verwendet (Punkte, mit denen die Daten in vier gleichgroße Gruppen aufgeteilt werden), um die Form der Daten abzubilden. Die Box umfasst das 1. und 3. Quartil, welche jeweils den 25. und 75. Perzentilen entsprechen. Die Linie in der Box bildet das 2. Quartil ab, das dem Median entspricht.

Der Interquartilsabstand, von dem der Name dieser Methode zur Erkennung von Ausreißern stammt, ist der Abstand zwischen dem ersten und dem dritten Quartil (die Ränder der Box). Tukey betrachtete jeden Datenpunkt außerhalb des 1,5-fachen IQR-Werts unterhalb der ersten – oder des 1,5-fachen IQR-Werts oberhalb der dritten – Quartile als moderate oder extreme Ausreißer. In einem klassischen Box- und Whisker-Plot erstrecken sich die Antennen (Whisker) bis zum letzten Datenpunkt, der noch kein Ausreißer ist.

Der Interquartilsabstand (IQR) ist eine Kennzahl für die Variabilität, die darauf basiert, ein Dataset in Quartile einzuteilen. Quartile teilen ein dem Rang nach geordnetes Dataset in vier gleiche Teile auf. Q1, Q2 & Q3. IQR ist definiert als Q3–Q1. Alle Daten, die außerhalb von "Q3+1,5*IQR" oder "Q1-1,5*IQR" liegen, gelten als Ausreißer.


IQR-Beispiel