次の表に示されているように、Oracle Data Miningは、VARCHAR2
、CHAR
、CLOB
、BLOB
およびBFILE
の列に格納された非構造化テキストをサポートしています。
表7-1 非構造化テキストを格納できる列のデータ型
データ型 | 説明 |
---|---|
|
Oracle Data Miningでは、モデルの作成時に |
|
Oracle Data Miningでは、 |
|
Oracle Data Miningでは、デフォルトでは |
|
Oracle Data Miningでは、4000より長いデータを持つ Oracle Data Miningでは、デフォルトでは長さが4000以下のデータを持つ |
次の表に示す設定により、モデルのテキスト属性に対する用語抽出プロセスが制御されます。モデルの設定を指定する方法は、「モデルの設定の指定」を参照してください。
表7-2 テキスト用のモデルの設定
設定名 | データ型 | 設定値 | 説明 |
---|---|---|---|
|
|
|
非構造化テキストからの個々のトークンの抽出方法に影響を与える。「テキスト・ポリシーの作成」を参照。 |
|
|
1 <= 値 <= 100000 |
デフォルトは3000です。 |
モデルには1つ以上のテキスト属性を含めることができます。テキスト属性を持つモデルには、質的属性と量的属性を含めることもできます。
テキスト属性を含むモデルを作成するには、次の手順を実行します。
Oracle Textのポリシー・オブジェクトを作成します(「テキスト・ポリシーの作成」を参照)。
表7-2で説明されているモデルの構成設定を指定します。
テキストとして処理する必要がある列を指定し、必要に応じて、個々の属性に対してテキスト変換の方法を指定します。「テキスト属性の構成」を参照してください。
モデルの設定とテキスト変換指示をDBMS_DATA_MINING.CREATE_MODEL
に渡します。「モデルへの変換の組込み」を参照してください。
注意:
O-Clusterを除くすべてのアルゴリズムでは、非構造化テキストの列をサポートできます。
相関ルール(Apriori)では非構造化テキストを使用しないことをお薦めします。