17.6 Unsupervised Anomaly Detection GraphWiseアルゴリズムの使用(頂点埋込みおよび異常スコア)
UnsupervisedAnomalyDetectionGraphWiseは、頂点およびエッジの特徴情報を利用できる、帰納的な頂点表現学習および異常検出アルゴリズムです。様々なタスクに適用できますが、異常検出のための頂点埋込みの教師なし学習に特に適しています。このモデルのトレーニング後、表示されないノードの異常スコアまたはラベルを推測できます。
UnsupervisedAnomalyDetectionGraphWise
は、Ding、KaizeらによるDeep Anomaly Detection on Attributed Networks (Dominant)に基づいています。
モデル体系
UnsupervisedAnomalyDetectionGraphWise
モデルは、グラフの畳込み層とそれに続く埋込み層で構成されます。埋込み層には、DGI層とDominant層の2つのタイプがあります。どちらの層も、様々な損失関数を使用した帰納的な頂点表現学習用です。埋込み層のデフォルトはDGI層です。
頂点の畳込み層を通過する前方パスは、次のように処理されます。
- 頂点の近隣のセットがサンプリングされます。
- 近隣の前の層表現は平均集約され、集約された特徴は頂点の前の層表現と連結されます。
- この連結されたベクトルに重みが乗算され、バイアス・ベクトルが追加されます。
- 結果は、層出力が単位ノルムを持つように正規化されます。
VelickovicなどによるDeep Graph Infomax (DGI)に基づくDGI層は、3つの部分で構成され、畳込み層によって生成された埋込みを使用して教師なし学習を可能にします。
- Corruption関数: グラフ構造を保持しながらノードの特徴をシャッフルし、畳込み層を使用して負の埋込みサンプルを生成します。
- Readout関数: グラフのサマリーとして使用される、シグモイドによって活性化された埋込みの平均。
- 識別器: 損失関数の計算元となるサマリーとの負のサンプルの類似性に加えて、サマリーとの正の(シャッフルされていない)埋込みの類似性を測定します。
これらのいずれにも可変のハイパーパラメータが含まれていないため、デフォルトのDGI層が常に使用され、これを調整することはできません。
Dominant層は、ディープ・オートエンコーダを使用した教師なし学習を可能にします。グラフ畳込みネットワーク(GCN)を使用して、オートエンコーダ設定の機能を、埋込みの内積を使用して推定される再構築された構造とともに再構築します。
損失関数は、フィーチャ再構築の損失と構造再構築の損失から計算します。フィーチャまたは構造に対する重要性は、alphaハイパーパラメータを使用して調整できます。
Dominant層は、Ding、Kaizeらによる『Deep Anomaly Detection on Attributed Networks (Dominant)』に基づいています。
次に、PGXでのDominant
実装の主な機能の使用方法について説明します。この例は、フィーチャに基づいて不正な頂点を検出するシナリオを示しています。
- グラフのロード
- 最小限のUnsupervised Anomaly Detection GraphWiseモデルの作成
- 高度なハイパーパラメータ・カスタマイズ
- パーティション・グラフを使用したUnsupervised Anomaly Detection GraphWiseモデルの作成
- Unsupervised Anomaly Detection GraphWiseモデルのトレーニング
- Unsupervised Anomaly Detection GraphWiseモデルのloss値の取得
- Unsupervised Anomaly Detection GraphWiseモデルの埋込みの推測
- 異常の推測
- Unsupervised Anomaly Detection GraphWiseモデルの格納
- 事前トレーニング済Unsupervised Anomaly Detection GraphWiseモデルのロード
- Unsupervised Anomaly Detection GraphWiseモデルの破棄
親トピック: グラフ用の機械学習ライブラリ(PgxML)の使用