プライマリ・コンテンツに移動
Oracle® Data Miningユーザーズ・ガイド
12c リリース1 (12.1)
B72967-05
目次へ移動
目次
索引へ移動
索引

前
次

テキスト・マイニングを含むモデルの作成

次の表に示されているように、Oracle Data Miningは、VARCHAR2CHARCLOBBLOBおよびBFILEの列に格納された非構造化テキストをサポートしています。

表7-1 非構造化テキストを格納できる列のデータ型

データ型 説明

BFILEおよびBLOB

Oracle Data Miningでは、モデルの作成時にBLOBおよびBFILEの列をテキストとして特定した場合のみ、これらの列をテキストとして解釈します。列をテキストとして特定していない場合は、CREATE_MODELがエラーを戻します。

CLOB

Oracle Data Miningでは、CLOBをテキストとして解釈します。

CHAR

Oracle Data Miningでは、デフォルトではCHARを質的として解釈します。モデルの作成時に、CHARの列をテキストとして特定することができます。

VARCHAR2

Oracle Data Miningでは、4000より長いデータを持つVARCHAR2をテキストとして解釈します。

Oracle Data Miningでは、デフォルトでは長さが4000以下のデータを持つVARCHAR2を質的として解釈します。モデルの作成時に、これらの列をテキストとして特定することができます。

注意:

テキストは、ネストした列ではサポートされておらず、また監視ありデータ・マイニングでターゲットとして使用することはできません。

次の表に示す設定により、モデルのテキスト属性に対する用語抽出プロセスが制御されます。モデルの設定を指定する方法は、「モデルの設定の指定」を参照してください。

表7-2 テキスト用のモデルの設定

設定名 データ型 設定値 説明

ODMS_TEXT_POLICY_NAME

VARCHAR2(4000)

CTX_DDL.CREATE_POLICYで作成されたOracle Textのポリシー・オブジェクトの名前。

非構造化テキストからの個々のトークンの抽出方法に影響を与える。「テキスト・ポリシーの作成」を参照。

ODMS_TEXT_MAX_FEATURES

INTEGER

1 <= <= 100000

CREATE_MODELに渡される(各テキスト列のすべてのドキュメントの)ドキュメント・セットから使用する特徴の最大数。

デフォルトは3000です。

モデルには1つ以上のテキスト属性を含めることができます。テキスト属性を持つモデルには、質的属性と量的属性を含めることもできます。

テキスト属性を含むモデルを作成するには、次の手順を実行します。

  1. Oracle Textのポリシー・オブジェクトを作成します(「テキスト・ポリシーの作成」を参照)。

  2. 表7-2で説明されているモデルの構成設定を指定します。

  3. テキストとして処理する必要がある列を指定し、必要に応じて、個々の属性に対してテキスト変換の方法を指定します。「テキスト属性の構成」を参照してください。

  4. モデルの設定とテキスト変換指示をDBMS_DATA_MINING.CREATE_MODELに渡します。「モデルへの変換の組込み」を参照してください。

    注意:

    O-Clusterを除くすべてのアルゴリズムでは、非構造化テキストの列をサポートできます。

    相関ルール(Apriori)では非構造化テキストを使用しないことをお薦めします。