統計的レバレッジ・スコア
統計的レバレッジ・スコアでは、最も代表的な列または行が選択されます。これは、重要なデータ・ポイントの選択に役立ちます。
レバレッジ・スコアは、マトリックスのランク・サブスペースに関して最も代表的な列(または行)を決定する統計です。統計的レバレッジ・スコアは、列(または属性)と行の重要度を表します。すべての列の正規化された統計的レバレッジ・スコアは、次のように上位k個の右特異ベクトルから計算されます。
ここで、kはランク・パラメータと呼ばれ、
j = 1,...,n
となります。πj>=0とし、
とすると、これらのスコアはn列の確率分布を形成します。
同様に、すべての行の正規化された統計的レバレッジ・スコアは、上位k個の左特異ベクトルから次のように計算されます。
ここで、i = 1,...,m
です。