Unsupervised GraphWiseアルゴリズムの使用(頂点埋込み)

17.4 Unsupervised GraphWiseアルゴリズムの使用(頂点埋込み)

Unsupervised GraphWiseは、頂点情報を利用できる、教師なしの帰納的な頂点表現学習アルゴリズムです。学習した埋込みは、頂点分類、頂点クラスタリング、類似の頂点検索など、様々なダウンストリーム・タスクで使用できます。

Unsupervised GraphWiseは、VelickovicらによるDeep Graph Infomax (DGI)に基づいています。

モデル体系

Unsupervised GraphWiseモデルは、グラフの畳込み層とそれに続く埋込み層で構成され、デフォルトはDGI層になります。

頂点の畳込み層を通過する前方パスは、次のように処理されます。

DGI層は3つの部分で構成され、畳込み層によって生成された埋込みを使用することで、教師なし学習が可能になります。

これらのいずれにも可変のハイパーパラメータが含まれていないため、デフォルトのDGI層が常に使用され、これを調整することはできません。

使用可能な2番目の埋込み層は、Dominant層です。

Dominantは、フィーチャと近接の構造に基づいて異常を検出するモデルです。GCNを使用してオートエンコーダの設定のフィーチャ、および埋込みの内積のあるマスクを再構築します。

損失関数は、フィーチャ再構築の損失と構造再構築の損失から計算します。フィーチャまたは構造に対する重要性は、alphaハイパーパラメータを使用して調整できます。

次に、UnsupervisedGraphWiseアルゴリズムを適用できるユースケースをいくつか説明します:

金融取引での不正検出: 取引ネットワークを分析し、口座や取引について埋込みを生成することで、不正アクティビティのクラスタを特定します。これは、未知の詐欺パターンを検出するために役立ちます。
ネットワークの最適化: トラフィック・パターンに基づいてネットワーク・ノード(ルーターや携帯電話基地局など)をクラスタ化することで、通信におけるネットワーク・パフォーマンスを最適化します。これは、データ・フローを改善し、待機時間を短縮するために役立ちます。
バイオインフォマティクス: タンパク質とタンパク質の相互作用ネットワークを分析し、同様の機能を共有している可能性があるタンパク質の新しいクラスタまたはコミュニティを発見します。これは、創薬、および生物学的過程の理解に役立ちます。

次に、Coraグラフを例として使用して、PGXでのDGIの実装における主な機能の使用方法を示します。

親トピック: グラフ用の機械学習ライブラリ(PgxML)の使用