31.2 CREATE_MODELプロシージャ
DBMS_DATA_MINING
パッケージのCREATE_MODEL
プロシージャは、指定されたデータを使用して、指定された名前およびマイニング機能を持つマイニング・モデルを作成します。モデルは、構成設定とユーザー指定の変換を使用して作成できます。
PROCEDURE CREATE_MODEL( model_name IN VARCHAR2, mining_function IN VARCHAR2, data_table_name IN VARCHAR2, case_id_column_name IN VARCHAR2, target_column_name IN VARCHAR2 DEFAULT NULL, settings_table_name IN VARCHAR2 DEFAULT NULL, data_schema_name IN VARCHAR2 DEFAULT NULL, settings_schema_name IN VARCHAR2 DEFAULT NULL, xform_list IN TRANSFORM_LIST DEFAULT NULL);
31.2.1 マイニング機能の選択
CREATE_MODEL
へのマイニング機能の提供について説明します。
マイニング機能は、CREATE_MODEL
プロシージャに必須の引数です。データ・マイニング機能によって、モデル化や解決の対象となり得る問題のクラスが特定されます。
データ・マイニング機能は、教師あり学習または教師なし学習のいずれかを実装しています。教師あり学習では、独立属性のセットを使用して従属属性の値またはターゲットを予測します。教師なし学習では従属属性と独立属性は区別されません。教師あり機能は予測的です。教師なし機能は記述的です。
ノート:
データ・マイニングの用語では、機能(function)とは、特定のデータ・マイニング・アプローチを使用して解決される問題の一般的な種類です。SQL言語の用語では、関数(function)は値を戻す演算子です。
Oracle Data Miningのドキュメントでは、機能(function)またはマイニング機能(mining function)という用語は、データ・マイニング機能を表し、SQL関数(SQL function)またはSQLデータ・マイニング関数(SQL Data Mining function)という用語は、スコアリング(データ・マイニング・モデルの適用)用のSQL関数を表します。
CREATE_MODEL
のmining_function
パラメータに指定できる値を次の表に示します。
表31-2 マイニング・モデルの機能
関連トピック
31.2.2 アルゴリズムの選択
モデルのアルゴリズム設定の指定について学習します。
ALGO_NAME
設定では、モデルのアルゴリズムを指定できます。マイニング機能に対してデフォルトのアルゴリズムを使用する場合、または使用できるアルゴリズムが1つしかない場合は、ALGO_NAME
設定を指定する必要はありません。モデルの設定を指定する手順については、「モデルの設定の指定」を参照してください。
表31-3 データ・マイニングのアルゴリズム
ALGO_NAMEの値 | アルゴリズム | デフォルトかどうか | マイニング・モデルの機能 |
---|---|---|---|
|
— |
||
|
— |
||
|
|||
|
— |
||
|
期待値最大化 |
||
|
— |
||
|
— |
||
ALGO_EXTENSIBLE_LANG |
— |
すべてのマイニング機能がサポートされています |
|
|
— |
||
|
デフォルト |
||
|
デフォルト |
||
|
— |
||
|
デフォルト |
||
|
— |
クラスタリング |
|
|
— |
||
|
— |
特徴抽出 |
|
|
デフォルト |
関連トピック
31.2.3 変換の指定
31.2.3.1 変換リストの作成
変換リストを作成する方法は次のとおりです。
-
DBMS_DATA_MINING_TRANSFORM
のSTACK
インタフェース。STACK
インタフェースは、属性または属性のグループに適用可能な事前定義された変換のセットを提供します。たとえば、すべての質的属性に対して教師ありビニングを指定することができます。 -
DBMS_DATA_MINING_TRANSFORM
のSET_TRANSFORM
プロシージャ。SET_TRANSFORM
プロシージャは、指定されたSQL式を指定された属性に適用します。たとえば、次の文では、country_id
の変換指示を、my_xforms
という変換リストに追加します。変換指示は、アルゴリズムの処理が開始される前にcountry_id
を10で割ります。逆変換はcountry_id
に10を掛けます。dbms_data_mining_transform.SET_TRANSFORM (my_xforms, 'country_id', NULL, 'country_id/10', 'country_id*10');
逆変換はモデルの詳細で適用されます。
country_id
が教師ありモデルのターゲットである場合、逆変換はスコアリングされるターゲットにも適用されます。
31.2.3.2 変換リストおよび自動データ準備
変換リストと自動データ準備(ADP)間の相互作用について理解します。
CREATE_MODEL
に対する変換リスト引数は、自動データ準備(ADP)を制御するPREP_AUTO
設定と次のように相互作用します。
-
ADPが有効で、変換リストを指定した場合、ユーザー指定の変換は自動変換とともに適用されてモデルに組み込まれます。指定した変換は、自動変換の前に実行されます。
-
ADPが無効で、変換リストを指定した場合、ユーザー指定の変換が適用されてモデルに組み込まれますが、システム生成の変換は実行されません。
-
ADPが有効で、変換リストを指定しなかった場合、システム生成の変換が適用されてモデルに組み込まれます。
-
ADPが無効で、変換リストも指定しなかった場合、変換はモデルに組み込まれません。モデルの作成、テストおよびスコアリングに使用するデータセットは別個に準備する必要があります。