Zスコア

説明

Zスコア(または標準スコア)は、ポイントのグループの平均および標準偏差との関係に関してデータ・ポイントを説明する手法です。Zスコアを取得するには、単に、平均が0として定義され、標準偏差が1として定義された分布にデータをマップします。

Zスコアを取得する目的は、データの場所とスケールの影響を取り除いて、様々なデータセットを直接比較できるようにすることです。外れ値検出のZスコア手法の背後にある直感的な考え方は、データを中央に配置し、再スケールした後、ゼロから離れすぎているもの(しきい値は通常、Zスコア3または-3)を外れ値とみなすというものです。

データが正規分布(ベル型曲線)であると仮定すると、平均 + 3*SD (標準偏差)によって観測値の99.7%が取得されます。統計的には、この範囲外にある値は異常とみなされます。


Zスコアの例