ESAによるスコアリング

明示的セマンティック分析(ESA)の特徴抽出の典型的な用途は、指定された入力に最も関連する特徴の識別と、その関連性のスコアリングです。ESAモデルのスコアリングによって、概念の特徴空間にデータ投影が生成されます。

ESAモデルがドキュメントの任意の集合から作成される場合、それぞれが機能として扱われます。これにより、集合内で最も関連するドキュメントを特定できます。特徴抽出関数は、FEATURE_DETAILS、FEATURE_ID、FEATURE_SET、FEATURE_VALUEおよびFEATURE_COMPAREです。ESA埋込みの実装で同じ関数を利用しますが、機能の空間は異なります。ESA埋込みの機能の名前は、1から始まる連続する整数です。FEATURE_IDの出力は数値です。FEATURE_SETおよびFEATURE_DETAILSの出力の機能IDも数値です。

ESAの一般的な分類の用途は、特定のドキュメントについてクラスを予測して、その予測の確率を推定することです。分類アルゴリズムとしてのESAは、スコアリング・ファンクションのPREDICTION、PREDICTION_PROBABILITY、PREDICTION_SET、PREDICTION_DETAILS、PREDICTION_COSTを実装しています。

関連トピック