明示的セマンティック分析の用語
明示的セマンティック分析(ESA)に関連する用語について説明します。
複数ターゲットの分類
大規模な分類では、トレーニング項目が複数のクラスに属しています。このような場合の分類の目的は、1つの項目に対して考えられるターゲット・クラスを複数個検出することです。この種の分類は、多ターゲットの分類と呼ばれます。ESAベースの分類のターゲット列は拡張されています。各集合は、ターゲット列の値として受け入れられます。ESAベースの分類でのターゲットの集合タイプは、ORA_MINING_VARCHAR2_NT
です。
大規模な分類
大規模な分類は、通常は何万または何十万にも及ぶ、膨大な数のカテゴリを含むオントロジに適用されます。このような大規模な分類では、膨大なトレーニング・データセットも必要となります。こうしたデータセットは不均一であることが多く、一部のクラスはかなりの数のトレーニング・サンプルを有しているが、他のクラスはトレーニング・データセット内でまばらに存在するという可能性があります。通常、大規模な分類では、指定されたテスト・ケースに対して複数のターゲット・クラスが割り当てられます。
トピックのモデリング
トピックのモデリングとは、ドキュメントの最も重要なトピックを導出することです。トピックのモデリングは、明示的または潜在的に行うことが可能です。明示的なトピックのモデリングを行うと、指定されたドキュメントに対し、事前定義されたセットから最も関連性の高いトピックが選択されます。明示的なトピックには名前があり、言語化できます。潜在的なトピックのモデリングでは、ドキュメントの集合に対し、一連の潜在的トピックの特性が識別されます。これらの潜在的トピックのサブセットは、検討対象のすべてのドキュメントに関連付けられています。潜在的なトピックには、言語による説明や意味のある解釈がありません。