15.1 DeepWalkアルゴリズムの使用

DeepWalkは、業界で広く使用されている頂点表現学習アルゴリズムです。

次の2つの主なステップで構成されています。

  1. まず、ランダム・ウォーク生成ステップで、各頂点のランダム・ウォークが計算されます(事前定義されたウォークの長さと、事前定義された頂点ごとのウォーク数を使用します)。
  2. 次に、これらの生成されたウォークがWord2vecアルゴリズムにフィードされ、各頂点(Word2vecアルゴリズムに提供される入力の単語)のベクトル表現が生成されます。DeepWalkアルゴリズムの詳細は、KDDのドキュメントを参照してください。

DeepWalkでは、特定のグラフの頂点埋込みが作成され、グラフに変更を組み込むように更新することはできません。かわりに、この変更されたグラフで新しいDeepWalkモデルをトレーニングする必要があります。最後に、DeepWalkモデルのメモリー使用量がO(2n*d)であることに注意することが重要です。ここで、nはグラフ内の頂点の数、dは埋込み長です。

次に、8,637,721の頂点と165,049,964のエッジを含む例としてDBpediaグラフを使用して、PGXでのDeepWalkの主な機能の使用方法を示します。