7.2 データ・モニター結果の表示
データ・モニター結果ページには、正常に実行された選択したデータ・モニターに関する情報が、各モニター対象機能のデータ・ドリフトの詳細とともに表示されます。
データ・モニター・ページで、正常に実行されたデータ・モニターをクリックします。この例では、データ・モニター「Power Consumption」が選択されています。データ・モニターの結果は、次のセクションで構成されるデータ・モニター結果ページに表示されます。
- 設定 — 「設定」セクションにデータ・モニターの設定が表示されます。このセクションを展開するには、「設定」の矢印をクリックします。データ・モニターの設定を編集するには、ページの右上隅にある「編集」をクリックします。このスクリーンショットでは、データ・モニターの設定が表示されています。
図7-10 データ・モニター結果ページの「設定」セクション
- ドリフト — 「ドリフト」セクションには、モニター対象の各機能のデータ・ドリフトの詳細が表示されます。この例では、データ・モニターの「Power Consumption」データ・モニターが選択されています。X軸は分析期間を表し、Y軸はデータ・ドリフト値を表します。横の点線はしきい値を示し、実線は分析期間の各時点のドリフト値を表します。マウスを線の上に置くと、ドリフト値が表示されます。
図7-11 データ・モニター結果ページのデータ・ドリフトセクション
-
機能 — 「機能」セクションには、モニター対象の機能と計算された統計が表示されます。
図7-12 データ・モニター結果ページの「機能」セクション
「重要度」列の値は、指定した期間に機能がデータ・ドリフトに与えた影響を示します。
数値データの場合は、次の統計が計算されます。- 平均
- 標準偏差
- 範囲(最小、最大)
- NULLの数
分類データの場合は、次の統計が計算されます。- 一意の値の数
- NULLの数
モニター対象の各機能については、このスクリーンショットに示すように、カーソルを移動して次の追加詳細を表示します。
- 最初: 分析期間について計算した統計の最初の値です。
- 最後: 分析期間について計算した統計の最後の値です。
- 最大: 分析期間について計算した統計の最大値です。
- 最小: 分析期間について計算した統計の最小値です。
- このスクリーンショットに示すように、「機能」セクションのモニター対象の機能をクリックして、「メトリック」、「統計」、「分散」およびクロス集計の列の分布を表示します。このスクリーンショットでは、機能GLOBAL_REACTIVE_POWERのPopulation Stability Indexが表示されています。
図7-13 Population Stability Index
計算には次のものがあります:- メトリック: 次のメトリックが計算されます。
- Population Stability Index (PSI): これは、集団が時間の経過とともに、または1つの数値の集団の2つの異なるサンプル間でシフトした量の測定値です。2つの分布はバケットに入れられ、PSIは各バケット内のアイテムのパーセントを比較します。PSIは次のように計算されます
PSI値の解釈は次のとおりです。PSI = sum((Actual_% - Expected_%) x ln (Actual_% / Expected_%))
PSI < 0.1
は、集団に大きな変化がないことを意味します0.1 <= PSI < 0.2
は、集団に中程度の変更があることを意味しますPSI >= 0.2
は、集団に大幅な変化があることを意味します
- Jenson Shannon Distance (JSD): これは、2つの確率分布間の類似性の尺度です。JSDは、カルバック・ライブラー情報量(KLD)に関連するJensen-Shannon Divergenceの平方根です。JSDは次のように計算されます。
SD(P || Q)= sqrt(0.5 x KLD(P || M) + 0.5 x KLD(Q || M))
ここで、PとQは2つの分散、
M = 0.5 x (P + Q), KLD(P || M) = sum(Pi x ln(Pi / Mi))、およびKLD(Q || M) = sum(Qi x ln(Qi / Mi))
ですJSDの値は0から1の範囲です。
- クロス集計Population Stability Index: これは2つの変数のPSIです。
- クロス集計Jenson Shannon Distance: これは2つの変数のJSDです。
- Population Stability Index (PSI): これは、集団が時間の経過とともに、または1つの数値の集団の2つの異なるサンプル間でシフトした量の測定値です。2つの分布はバケットに入れられ、PSIは各バケット内のアイテムのパーセントを比較します。PSIは次のように計算されます
- 統計: 選択した最大3期間の統計を表示できます。データ・ドリフトは、これらの統計の計算を使用して定量化されます。
図7-14 統計
数値データの場合は、次の統計が計算されます。- 平均
- 標準偏差
- 範囲(最小、最大)
- NULLの数
分類データの場合は、次の統計が計算されます。- 一意の値の数
- NULLの数
- 分布: 凡例を含む機能の分布チャートには、選択した期間とベースラインの機能のビンが表示されます(オプション)。
図7-15 「分布」チャートとクロス集計の列の分布
- クロス集計の列の分布: ヒート・マップは、選択したクロス集計および機能の列の分布の密度を示します。赤は最高の密度を示します。
ノート:
データ・ドリフト・モニタリングでは、null
はnumber_of_missing_values
として個別に追跡されます。
- メトリック: 次のメトリックが計算されます。
親トピック: データ・モニタリングの概要