ESAによるスコアリング
明示的セマンティック分析(ESA)の特徴抽出の典型的な用途は、指定された入力に最も関連する特徴の識別と、その関連性のスコアリングです。ESAモデルのスコアリングによって、概念の特徴空間にデータ投影が生成されます。
ESAモデルがドキュメントの任意の集合から作成される場合、それぞれが機能として扱われます。これにより、集合内で最も関連するドキュメントを特定できます。特徴抽出関数は、FEATURE_DETAILS
、FEATURE_ID
、FEATURE_SET
、FEATURE_VALUE
およびFEATURE_COMPARE
です。ESA埋込みの実装で同じ関数を利用しますが、機能の空間は異なります。ESA埋込みの機能の名前は、1から始まる連続する整数です。FEATURE_ID
の出力は数値です。FEATURE_SET
およびFEATURE_DETAILS
の出力の機能IDも数値です。
ESAの一般的な分類の用途は、特定のドキュメントについてクラスを予測して、その予測の確率を推定することです。分類アルゴリズムとしてのESAは、スコアリング・ファンクションのPREDICTION
、PREDICTION_PROBABILITY
、PREDICTION_SET
、PREDICTION_DETAILS
、PREDICTION_COST
を実装しています。