17.5 Unsupervised EdgeWiseアルゴリズムの使用

UnsupervisedEdgeWiseは、頂点およびエッジの特徴情報を利用できる、帰納的なエッジ表現学習アルゴリズムです。エッジ分類のためのエッジ埋込みの教師なし学習など、様々なタスクに適用できます。

Unsupervised EdgeWiseは、GraphWiseモデルの上部に基づいており、GraphWiseモデルによって生成されたソース頂点埋込みと宛先頂点埋込みを利用して、帰納的なエッジ埋込みを生成します。

トレーニングは、VelickovicらによるDeep Graph Infomax (DGI)に基づいています。

モデル体系

UnsupervisedEdgeWiseモデルは、グラフの畳込み層とそれに続く埋込み層で構成され、デフォルトはDGI層になります。

まず、ターゲット・エッジのソース頂点と宛先頂点が畳込み層を介して処理されます。頂点の畳込み層を通過する前方パスは、次のように処理されます。

  1. 頂点の近隣のセットがサンプリングされます。
  2. 近隣の前の層表現は平均集約され、集約された特徴は頂点の前の層表現と連結されます。
  3. この連結されたベクトルに重みが乗算され、バイアス・ベクトルが追加されます。
  4. 結果は、層出力が単位ノルムを持つように正規化されます。

エッジ埋込み層は、ソース頂点埋込み、エッジの特徴および宛先頂点埋込みを連結し、線形層を介して転送してエッジ埋込みを取得します。

DGI層は3つの部分で構成され、畳込み層によって生成された埋込みを使用することで、教師なし学習が可能になります。

  1. Corruption関数: グラフ構造を保持しながらノードの特徴をシャッフルし、畳込み層を使用して負の埋込みサンプルを生成します。
  2. Readout関数: グラフのサマリーとして使用される、シグモイドによって活性化された埋込みの平均。
  3. 識別器: 損失関数の計算元となるサマリーとの負のサンプルの類似性に加えて、サマリーとの正の(シャッフルされていない)埋込みの類似性を測定します。

これらのいずれにも可変のハイパーパラメータが含まれていないため、デフォルトのDGI層が常に使用され、これを調整することはできません。

使用可能な2番目の埋込み層は、Dominant層です。

Dominantは、フィーチャと近接の構造に基づいて異常を検出するモデルです。GCNを使用してオートエンコーダの設定のフィーチャ、および埋込みの内積のあるマスクを再構築します。

損失関数は、フィーチャ再構築の損失と構造再構築の損失から計算します。フィーチャまたは構造に対する重要性は、alphaハイパーパラメータを使用して調整できます。

次に、UnsupervisedEdgeWiseアルゴリズムを適用できるユースケースをいくつか説明します:

  • サプライ・チェーンの最適化: サプライ・チェーン・ネットワーク内の様々なエンティティの間の関係を分析します。これは、遅延や混乱の可能性を予測し、それによって物流管理と在庫管理を最適化するために役立ちます。
  • コラボレーション・ネットワーク分析: 研究環境または企業社会環境での個人間または部門間の協業パターンを理解します。これは、チーム構造を改善し、生産性を高めるために役立ちます。
  • Eコマースでの推奨: 購入ネットワーク内の様々な製品の間の関係を分析することで、頻繁に一緒に購入されている製品を推奨します(エッジ埋込みを使用)。

次に、Movielensグラフを例として使用して、PGXでのUnsupervisedEdgeWiseの主な機能の使用方法を示します。