15.1 DeepWalkアルゴリズムの使用
DeepWalkは、業界で広く使用されている頂点表現学習アルゴリズムです。
次の2つの主なステップで構成されています。
- まず、ランダム・ウォーク生成ステップで、各頂点のランダム・ウォークが計算されます(事前定義されたウォークの長さと、事前定義された頂点ごとのウォーク数を使用します)。
- 次に、これらの生成されたウォークがWord2vecアルゴリズムにフィードされ、各頂点(Word2vecアルゴリズムに提供される入力の単語)のベクトル表現が生成されます。DeepWalkアルゴリズムの詳細は、KDDのドキュメントを参照してください。
DeepWalkでは、特定のグラフの頂点埋込みが作成され、グラフに変更を組み込むように更新することはできません。かわりに、この変更されたグラフで新しいDeepWalkモデルをトレーニングする必要があります。最後に、DeepWalkモデルのメモリー使用量がO(2n*d)
であることに注意することが重要です。ここで、n
はグラフ内の頂点の数、d
は埋込み長です。
次に、8,637,721
の頂点と165,049,964
のエッジを含む例としてDBpediaグラフを使用して、PGXでのDeepWalkの主な機能の使用方法を示します。