Z 分數

描述

Z 分數 (也稱標準分數) 就是用來描述單一資料點與一組資料點的平均值和標準差之間關係的方式。若要取得 Z 分數,只要將資料對映到其平均值被定義為 0,且標準差被定義為 1 的資料分布中即可。

取得 Z 分數的目的,是要移除資料位置和比例所造成的影響,讓您能夠直接比較不同的資料集。而用 Z 分數來偵測極端值的方法,就是當我們將資料置中並重新調整比例之後,任何離 0 太遠的資料點 (臨界點的 Z 分數通常是 3 或 -3) 就應視為極端值。

假設資料的分布正常 (鐘形曲線),平均值 + 3*SD (標準差) 將會涵蓋 99.7% 的觀測值。就統計上來說,落在此範圍外的所有資料,都會被視為異常。


Z 分數範例