NMFでのテキスト分析

Non-Negative Matrix Factorization(NMF)でのテキスト分析について学習します。

NMFは、特にテキストの分析に適しています。テキスト・ドキュメントでは、同じ言葉が異なる場所で別の意味を持って出現することがあります。たとえば、「hike」という単語は、アウトドア(outdoor)または金利(interest rate)に関連して使用されます。NMFでは、次のように属性を組み合せることによって、説明能力にとって必須であるコンテキストを取り入れます。

  • "hike" + "mountain" -> "outdoor sports"

  • "hike" + "interest" -> "interest rates"