IQR (écart interquartile)

La méthode IQR est une autre méthode fiable pour le libellé des valeurs aberrantes. La méthode IQR (écart interquartile) de détection des valeurs aberrantes a été développée par John Tukey, pionnier de l'analyse exploratoire des données. A l'époque, les calculs et les tracés graphiques étaient réalisés à la main, ce qui impliquait généralement de petits ensembles de données, et l'objectif principal était de comprendre l'histoire que racontaient les données.

Une boîte à moustaches utilise des quartiles (points qui divisent les données en quatre groupes de taille égale) pour représenter la forme des données. La boîte représente les premier et troisième quartiles, équivalents aux 25e et 75e centiles. La ligne à l'intérieur de la boîte représente le deuxième quartile, qui est la médiane.

L'écart interquartile, qui donne son nom à la méthode de détection des valeurs aberrantes, est l'écart entre le premier quartile et le troisième quartile (bordures de la boîte). Pour Tukey, tous les points de données qui se trouvent au-delà de 1,5 fois l'IQR en dessous du premier quartile ou au-dessus du troisième quartile sont exclus ou trop éloignés. Dans une boîte à moustaches classique, les moustaches s'étendent jusqu'au dernier point de données non exclu.

L'écart interquartile (IQR) est une mesure de la dispersion, basée sur la division de l'ensemble de données en quartiles. Les quartiles divisent un ensemble de données classé en quatre parties égales. Q1, Q2 et Q3 : l'IQR est défini comme Q3–Q1, et tout point de données en dehors de Q3+1,5*IQR ou Q1–1,5*IQR est considéré comme une valeur aberrante.


Exemple IQR