ESA用のデータ準備

自動データ準備では、明示的セマンティック分析(ESA)のために入力ベクターをユニット長に正規化します。

単純な(ネストされていない)データ型の列に欠損値がある場合、ESAによって質的データの欠損値は最頻値に、量的データの欠損値は平均値に自動的に置換されます。ネストした列に欠損値がある場合、ESAではそれらをスパースとして解釈します。スパースな量的データは0(ゼロ)に、スパースな質的データはゼロ・ベクターに置換されます。Oracle Machine Learning for SQLデータ準備では、入力テキストは実数のベクターに変換されます。これらの数値は、テキスト内の各用語の重要度を表しています。

参照:

使用可能なモデル設定のリストおよび説明は、DBMS_DATA_MINING - アルゴリズムの設定: 明示的セマンティック分析を参照してください。

ノート:

モデル設定と同じ意味でハイパーパラメータという用語も使用されます。