モデルの作成

25 モデルの作成

データ・マイニング・モデルを作成し、モデルの詳細を問い合せる方法について説明します。

25.1 モデルを作成する前の作業

モデルを作成する前に必要とされる準備手順について説明します。

モデルは、データ・マイニングを実行するデータベース・スキーマ・オブジェクトです。DBMS_DATA_MINING PL/SQLパッケージは、マイニング・モデル(モデルの詳細)の作成、構成、評価および問合せを行うAPIです。

モデルを作成する前に、そのモデルで実行する処理を決定する必要があります。トレーニング・データを特定し、変換が必要かどうかを判断する必要があります。モデルの設定を指定して、モデルの動作に影響を与えることができます。次の表は、準備の手順をまとめたものです。

表25-1 マイニング・モデルを作成する準備

準備手順	説明
マイニング機能の選択	「マイニング機能の選択」を参照
アルゴリズムの選択	「アルゴリズムの選択」を参照
作成(トレーニング)データの特定	「データの準備」を参照
テスト・データの特定(分類モデルの場合)	「分類および回帰用のデータ・セット」を参照
データ変換の方針の決定	「データの変換」を参照
設定表の作成と移入(必要な場合)	「モデルの設定の指定」を参照

関連項目

25.2 CREATE_MODELプロシージャ

DBMS_DATA_MININGパッケージのCREATE_MODELプロシージャは、指定されたデータを使用して、指定された名前およびマイニング機能を持つマイニング・モデルを作成します。モデルは、構成設定とユーザー指定の変換を使用して作成できます。

PROCEDURE CREATE_MODEL(
                  model_name            IN VARCHAR2,
                  mining_function       IN VARCHAR2,
                  data_table_name       IN VARCHAR2,
                  case_id_column_name   IN VARCHAR2,
                  target_column_name    IN VARCHAR2 DEFAULT NULL,
                  settings_table_name   IN VARCHAR2 DEFAULT NULL,
                  data_schema_name      IN VARCHAR2 DEFAULT NULL,
                  settings_schema_name  IN VARCHAR2 DEFAULT NULL,
                  xform_list            IN TRANSFORM_LIST DEFAULT NULL);

25.2.1 マイニング機能の選択

CREATE_MODELへのマイニング機能の提供について説明します。

マイニング機能は、CREATE_MODELプロシージャに必須の引数です。データ・マイニング機能によって、モデル化や解決の対象となり得る問題のクラスが特定されます。

データ・マイニング機能は、監視あり学習または監視なし学習のいずれかを実装しています。監視あり学習では、独立属性のセットを使用して従属属性の値またはターゲットを予測します。監視なし学習では従属属性と独立属性は区別されません。監視あり機能は予測的です。監視なし機能は記述的です。

注意:

データ・マイニングの用語では、機能(function)とは、特定のデータ・マイニング・アプローチを使用して解決される問題の一般的な種類です。SQL言語の用語では、関数(function)は値を戻す演算子です。

Oracle Data Miningのドキュメントでは、機能(function)またはマイニング機能(mining function)という用語は、データ・マイニング機能を表し、SQL関数(SQL function)またはSQLデータ・マイニング関数(SQL Data Mining function)という用語は、スコアリング(データ・マイニング・モデルの適用)用のSQL関数を表します。

CREATE_MODELのmining_functionパラメータに指定できる値を次の表に示します。

表25-2 マイニング・モデルの機能

Mining_Functionの値	説明
`ASSOCIATION`	相関は、記述マイニング機能の一種です。相関モデルによって、データ・セット内に存在する関係とその発生確率が識別されます(相関ルール)。相関モデルではAprioriアルゴリズムが使用される。
`ATTRIBUTE_IMPORTANCE`	属性評価(Attribute Importance)は、予測マイニング機能の一種。属性評価モデルは、特定の結果を予測する中で属性の相対的な重要度を識別する。属性評価モデルでは、最小記述長アルゴリズムが使用される。
`CLASSIFICATION`	分類(Classification)は、予測マイニング機能の一種。分類モデルは、履歴データを使用して質的ターゲットを予測する。分類モデルでは、Naive Bayes、ディシジョン・ツリー、ロジスティック回帰またはサポート・ベクター・マシンが使用される。デフォルトはNaive Bayes。分類機能は、異常検出にも使用可能。この場合、ターゲットがNULLであるSVMアルゴリズムが使用される(1クラスSVM)。
`CLUSTERING`	クラスタリングは、記述マイニング機能の一種です。クラスタリング・モデルは、データセットの中で自然なグループを識別する。クラスタリング・モデルでは、k-Means、O-Clusterまたは期待値最大化が使用される。デフォルトはk-Means。
`FEATURE_EXTRACTION`	特徴抽出(Feature Extraction)は、記述マイニング機能の一種。特徴抽出モデルは、最適化された属性のセットを作成する。特徴抽出モデルでは、Non-Negative Matrix Factorization、特異値分解(主成分分析にも使用可能)または明示的セマンティック分析が使用される。デフォルトはNon-Negative Matrix Factorization。
`REGRESSION`	回帰(Regression)は、予測マイニング機能の一種。回帰モデルは、履歴データを使用して量的ターゲットを予測する。回帰モデルでは、サポート・ベクター・マシンまたは線形回帰が使用される。デフォルトはサポート・ベクター・マシン。

関連項目

Oracle Data Mining概要

25.2.2 アルゴリズムの選択

モデルのアルゴリズム設定の指定について説明します。

ALGO_NAME設定では、モデルのアルゴリズムを指定できます。マイニング機能に対してデフォルトのアルゴリズムを使用する場合、または使用できるアルゴリズムが1つしかない場合は、ALGO_NAME設定を指定する必要はありません。モデルの設定を指定する手順については、「モデルの設定の指定」を参照してください。

表25-3 データ・マイニングのアルゴリズム

ALGO_NAMEの値	アルゴリズム	デフォルトかどうか	マイニング・モデルの機能
`ALGO_AI_MDL`	最小記述長	—	属性評価
`ALGO_APRIORI_ASSOCIATION_RULES`	Apriori	—	相関
`ALGO_DECISION_TREE`	ディシジョン・ツリー	—	分類
`ALGO_EXPECTATION_MAXIMIZATION`	期待値最大化
`ALGO_EXPLICIT_SEMANTIC_ANALYS`	明示的セマンティック分析	—	特徴抽出
`ALGO_EXTENSIBLE_LANG`	拡張可能アルゴリズムで使用される言語	—	すべてのマイニング機能がサポートされています
`ALGO_GENERALIZED_LINEAR_MODEL`	一般化線形モデル	—	分類、回帰
`ALGO_KMEANS`	k-Means	デフォルト	クラスタリング
`ALGO_NAIVE_BAYES`	Naive Bayes	デフォルト	分類
`ALGO_NONNEGATIVE_MATRIX_FACTOR`	Non-Negative Matrix Factorization	デフォルト	特徴抽出
`ALGO_O_CLUSTER`	O-Cluster	—	クラスタリング
`ALGO_SINGULAR_VALUE_DECOMP`	特異値分解(主成分分析にも使用可能)	—	特徴抽出
`ALGO_SUPPORT_VECTOR_MACHINES`	サポート・ベクター・マシン	デフォルト	デフォルトの回帰アルゴリズム回帰、分類、異常検出(ターゲットのない分類)

関連項目

25.2.3 変換の指定

必要に応じて、CREATE_MODELのxform_listパラメータで作成データに対する変換を指定できます。変換の指示がモデル内に組み込まれ、新しいデータへのモデルの適用時には常にその変換指示が再適用されます。

25.2.3.1 変換リストの作成

変換リストを作成する方法は次のとおりです。

DBMS_DATA_MINING_TRANSFORMのSTACKインタフェース。

STACKインタフェースは、属性または属性のグループに適用可能な事前定義された変換のセットを提供します。たとえば、すべての質的属性に対して監視ありビニングを指定することができます。
DBMS_DATA_MINING_TRANSFORMのSET_TRANSFORMプロシージャ。

SET_TRANSFORMプロシージャは、指定されたSQL式を指定された属性に適用します。たとえば、次の文では、country_idの変換指示を、my_xformsという変換リストに追加します。変換指示は、アルゴリズムの処理が開始される前にcountry_idを10で割ります。逆変換はcountry_idに10を掛けます。
```
  dbms_data_mining_transform.SET_TRANSFORM (my_xforms,
     'country_id', NULL, 'country_id/10', 'country_id*10');
```
逆変換はモデルの詳細で適用されます。country_idが監視ありモデルのターゲットである場合、逆変換はスコアリングされるターゲットにも適用されます。

25.2.3.2 変換リストおよび自動データ準備

変換リストと自動データ準備(ADP)間の相互作用について理解します。

CREATE_MODELに対する変換リスト引数は、自動データ準備(ADP)を制御するPREP_AUTO設定と次のように相互作用します。

ADPが有効で、変換リストを指定した場合、ユーザー指定の変換は自動変換とともに適用されてモデルに組み込まれます。指定した変換は、自動変換の前に実行されます。
ADPが無効で、変換リストを指定した場合、ユーザー指定の変換が適用されてモデルに組み込まれますが、システム生成の変換は実行されません。
ADPが有効で、変換リストを指定しなかった場合、システム生成の変換が適用されてモデルに組み込まれます。
ADPが無効で、変換リストも指定しなかった場合、変換はモデルに組み込まれません。モデルの作成、テストおよびスコアリングに使用するデータセットは別個に準備する必要があります。

関連項目

25.2.4 パーティション化されたモデルについて

Oracle Data Miningは、永続的なOracle Data Miningのパーティション化されたモデルの作成をサポートしています。パーティション化されたモデルでは、複数のモデルが単一のモデル・エンティティ内のパーティションとして編成され表されるため、ユーザーは独立したデータのスライスに合せてモデルを簡単に作成し管理できます。

永続的とは、パーティション化されたモデルがディスク上の表現を持つことを意味します。この製品は、パーティション化されたモデルの編成を管理し、パーティション化モデルのスコアリング・プロセスを簡素化します。スコアリング時、USING句の一部としてパーティション列を含める必要があります。

パーティション化されたモデルのパーティション名、キー値および構造は、ALL_MINING_MODEL_PARTITIONSビューに表示されます。

25.2.4.1 パーティション化されたモデルの作成プロセス

Oracle Data Miningでパーティション化されたモデルを作成するには、パーティション化キーが必要です。パーティション・キーは、設定表の作成設定を通じて設定します。

パーティション化キーとは、入力データ・セットからの1つ以上列(最大16)で構成されるカンマ区切りリストです。パーティション化キーは、パーティション化キーの離散値に基づいて、入力データを水平方向にスライスします。つまり、パーティション化は、連続した値に対する範囲のパーティション化とは対照的に、リスト値として実行されます。パーティション化キーは、NUMBERおよびVARCHAR2のデータ型の列のみをサポートしています。

作成プロセス中、入力データ・セットは、指定されたキーの個別値に基づいてパーティション化されます。各データ・スライス(一意のキー値)が、その独自のモデル・パーティションとなります。結果として作成されるモデル・パーティションは分かれておらず、スタンドアロン・モデルとして表示されません。パーティション化されたモデルのパーティションの最大数のデフォルト値は、1000パーティションです。異なるパーティション値を設定することもできます。入力データ・セットのパーティション数が、定義された最大数を超えている場合、Oracle Data Miningによって例外がスローされます。

パーティション化されたモデルでは、すべてのパーティションに共通の特徴、およびパーティション固有の特徴が編成されます。共通の特徴は、次のメタデータで構成されます。

モデル名
マイニング機能
マイニング・アルゴリズム
すべてのパーティションによって参照される全マイニング・モデル属性のスーパー・セット(シグネチャ)
ユーザー定義列変換の共通セット
グローバルと解釈されるユーザー指定またはデフォルトの作成設定。たとえば、自動データ準備(ADP)設定など

25.2.4.2 パーティション化されたモデル内のDDL

パーティション化されたモデルは、次のDDL操作を通じて管理されます。

25.2.4.2.1 モデルの削除またはパーティションの削除

Oracle Data Miningは、特定のパーティション名の単一のモデル・パーティションの削除をサポートしています。

1つのパーティションしか残っていない場合、そのパーティションを明示的に削除することはできません。かわりに、そのパーティションを削除する前に別のパーティションを追加するか、モデル自体の削除を選択できます。パーティション化されたモデルを削除する場合、すべてのパーティションは、単一のアトミック操作で削除されます。パフォーマンスの観点から、DROP_PARTITIONオプションは効率的に動作するため、REPLACEオプションを使用するのではなく、DROP_PARTITION、ADD_PARTITIONの順に実行することをお薦めします。

25.2.4.2.2 パーティションの追加

Oracle Data Miningは、単一のパーティションまたは複数のパーティションの既存のパーティション化されたモデルへの追加をサポートしています。

追加は、入力データ・セットおよび既存のパーティション化されたモデルの名前に基づいて発生します。操作は、入力データ・セットおよび既存のパーティション化されたモデルをパラメータとして使用します。パーティション・キーは、入力データ・セットから抽出され、モデル・パーティションは入力データ・セットに対して作成されます。このパーティションは、パーティション化されたモデルとして追加されます。新規パーティションのパーティション・キーがモデル内の既存パーティションと競合する場合、次の3つの手法から選択して競合を解決できます。

ERROR: パーティションを追加することなくADD操作を終了します。
REPLACE: 競合するキーが検出された既存のパーティションを置き換えます。
IGNORE: 競合するキーがある行を排除します。

入力データ・セットに複数のキーが含まれている場合、複数のパーティションが作成されます。モデル内のパーティションの合計数が、モデルの作成時に指定したユーザー定義最大数を超えると、エラーが発生します。パーティション数のデフォルトしきい値は1000です。

25.2.4.3 パーティション化されたモデルのスコアリング

パーティション化されたモデルのスコアリングについて説明します。

パーティション化されたモデルのスコアリングは、パーティション化されていないモデルのそれと同じです。データ・マイニング機能の構文は同じですが、オプションのヒントを提供するように拡張されています。オプションのヒントは、パーティション化されたモデルのスコアリングを含む問合せのパフォーマンスに影響を及ぼす可能性があります。

パーティション化されたモデルのスコアリングでは、パーティショニング・キーの作成中に使用されるシグネチャ列が、スコアリング・データセットに存在している必要があります。この列は、一意のパーティション・キーを形成するために組合されます。この一意のキーは、特定の基底となるモデル・パーティションにマップされ、識別されたモデル・パーティションがその行のスコアリングに使用されます。

スコアリングに必要なパーティション化オブジェクトが、問合せの実行時にオンデマンドでロードされ、システム・グローバル領域(SGA)メモリーに応じて有効期限が切れます。

関連項目

Oracle Database SQL言語リファレンス

25.3 モデルの設定の指定

データ・マイニング・モデルの作成時の構成方法について理解します。

データ・マイニング・モデルは、作成時に多数の構成設定を使用して構成できます。設定を指定するには、次の表に示す列を持つ設定表を作成し、その表をCREATE_MODELに渡します。

表25-4 設定表に必要な列

列名	データ型
`setting_name`	`VARCHAR2(30)`
`setting_value`	`VARCHAR2(4000)`

例25-1では、サポート・ベクター・マシン(SVM)分類モデルの設定表が作成されます。SVMはデフォルトの分類機能ではないため、ALGO_NAME設定を使用してこのアルゴリズムを指定します。SVMS_KERNEL_FUNCTIONをSVMS_LINEARに設定することにより、モデルは線形カーネルを使用して作成されます。カーネル関数を指定しない場合、アルゴリズムがデータの属性の数に基づいてカーネルを選択します。

通常はモデルに適用される設定と、アルゴリズムに固有の設定があります。モデルの設定は表25-5および表25-6を参照してください。

表25-5 一般的なモデルの設定

設定	説明
マイニング機能の設定	『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のマイニング機能の設定に関する説明を参照
アルゴリズムの名前	『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズム名に関する説明を参照
グローバルなモデルの特性	『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のグローバルな設定に関する説明を参照
自動データ準備	『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』の自動データ準備に関する説明を参照

表25-6 アルゴリズム固有のモデルの設定

アルゴリズム	説明
ディシジョン・ツリー	『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: ディシジョン・ツリーに関する説明を参照
期待値最大化	『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: 期待値最大化に関する説明を参照
明示的セマンティック分析	『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズム設定: 明示的セマンティック分析に関する説明を参照
一般化線形モデル	『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: 一般化線形モデルに関する説明を参照
k-Means	『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: k-Meansに関する説明を参照
Naive Bayes	『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: Naive Bayesに関する説明を参照
Non-Negative Matrix Factorization	『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: Non-Negative Matrix Factorizationに関する説明を参照
O-Cluster	『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: O-Clusterに関する説明を参照
特異値分解	『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: 特異値分解に関する説明を参照
サポート・ベクター・マシン	『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: サポート・ベクター・マシンに関する説明を参照

例25-1 SVM分類モデルの設定表の作成

CREATE TABLE svmc_sh_sample_settings (
  setting_name VARCHAR2(30),
  setting_value VARCHAR2(4000));

BEGIN 
  INSERT INTO svmc_sh_sample_settings (setting_name, setting_value) VALUES
    (dbms_data_mining.algo_name, dbms_data_mining.algo_support_vector_machines);
  INSERT INTO svmc_sh_sample_settings (setting_name, setting_value) VALUES
    (dbms_data_mining.svms_kernel_function, dbms_data_mining.svms_linear);
  COMMIT;
END;
/

関連項目

Oracle Database PL/SQLパッケージ・プロシージャおよびタイプ・リファレンス

25.3.1 コストの指定

ディシジョン・ツリー・モデルを作成するためのコスト・マトリックスを指定します。

CLAS_COST_TABLE_NAME設定は、ディシジョン・ツリー・モデルの作成に使用するコスト・マトリックス表の名前を指定します。コスト・マトリックスは、分類モデルにバイアスをかけて、コストのかかる分類ミスを最小化します。コスト・マトリックス表には、次の表に示す列が必要です。

表25-7 コスト・マトリックス表に必要な列

列名	データ型
`actual_target_value`	有効なターゲット・データ型
`predicted_target_value`	有効なターゲット・データ型
`cost`	`NUMBER`

ディシジョン・ツリーは、作成時にコスト・マトリックスを指定できる唯一のアルゴリズムです。ただし、スコアリングの際には、どの分類モデルにもコスト・マトリックスを作成して関連付けることができます。

スコアリングにコストを使用する場合は、表25-7に示す列を持つ表を作成し、DBMS_DATA_MINING.ADD_COST_MATRIXプロシージャを使用してコスト・マトリックス表をモデルに追加します。PREDICTION関数を呼び出すときに、コスト・マトリックスをインラインで指定することもできます。表23-1で、有効なターゲット・データ型の詳細を示しています。

関連項目

Oracle Data Mining概要

25.3.2 事前確率の指定

事前確率は、作成データと実際の母集団の間の分布の差を埋めるために使用されます。

CLAS_PRIORS_TABLE_NAME設定は、Naive Bayesモデルの作成に使用する事前確率表の名前を指定します。事前表には、次の表に示す列が必要です。

表25-8 事前確率表に必要な列

列名	データ型
`target_value`	有効なターゲット・データ型
`prior_probability`	`NUMBER`

関連項目

25.3.3 クラスに対する重みの指定

より高い重み付けのクラスを優先するには、ロジスティック回帰またはサポート・ベクター・マシン(SVM)分類でクラス重み表設定を指定します。

CLAS_WEIGHTS_TABLE_NAME設定は、より高い重み付けのクラスを優先するようにロジスティック回帰(一般化線形モデル分類)またはSVM分類のモデルにバイアスをかけるために使用する、クラスの重み表の名前を指定します。重み表には、次の表に示す列が必要です。

表25-9 クラスの重みの表に必要な列

列名	データ型
`target_value`	有効なターゲット・データ型
`class_weight`	`NUMBER`

関連項目

25.3.4 データ・ディクショナリにおけるモデルの設定

データ・ディクショナリ・ビューのALL/USER/DBA_MINING_MODEL_SETTINGSについて説明します。

マイニング・モデルの設定に関する情報は、データ・ディクショナリ・ビューALL/USER/DBA_MINING_MODEL_SETTINGSから取得できます。ALL接頭辞を使用した場合、このビューは、現在のユーザーがアクセスできるモデルの設定に関する情報を戻します。USER接頭辞を使用した場合は、ユーザー・スキーマ内のモデルの設定に関する情報を戻します。DBA接頭辞を使用できるのはDBAのみです。

ALL_MINING_MODEL_SETTINGSの列は次のとおりです。各列の説明は、次の表を参照してください

SQL> describe all_mining_model_settings
 Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 OWNER                                     NOT NULL VARCHAR2(30)
 MODEL_NAME                                NOT NULL VARCHAR2(30)
 SETTING_NAME                              NOT NULL VARCHAR2(30)
 SETTING_VALUE                                      VARCHAR2(4000)
 SETTING_TYPE                                       VARCHAR2(7)

表25-10 ALL_MINING_MODEL_SETTINGS

列	説明
`owner`	マイニング・モデルの所有者。
`model_name`	マイニング・モデルの名前。
`setting_name`	設定の名前。
`setting_value`	設定の値。
`setting_type`	`INPUT:` 値がユーザーによって指定される場合。`DEFAULT:` 値がシステムによって生成される場合。

次の問合せは、サポート・ベクター・マシン(SVM)の分類モデルSVMC_SH_CLAS_SAMPLEの設定をリストします。ALGO_NAME、CLAS_WEIGHTS_TABLE_NAMEおよびSVMS_KERNEL_FUNCTIONの設定はユーザーが指定しています。これらの設定は、モデルの設定表で指定されています。

例25-2 ALL_MINING_MODEL_SETTINGS

SQL> COLUMN setting_value FORMAT A35
SQL> SELECT setting_name, setting_value, setting_type
            FROM all_mining_model_settings
            WHERE model_name in 'SVMC_SH_CLAS_SAMPLE';
 
SETTING_NAME                   SETTING_VALUE                       SETTING
------------------------------ ----------------------------------- -------
SVMS_ACTIVE_LEARNING           SVMS_AL_ENABLE                      DEFAULT
PREP_AUTO                      OFF                                 DEFAULT
SVMS_COMPLEXITY_FACTOR         0.244212                            DEFAULT
SVMS_KERNEL_FUNCTION           SVMS_LINEAR                         INPUT
CLAS_WEIGHTS_TABLE_NAME        svmc_sh_sample_class_wt             INPUT
SVMS_CONV_TOLERANCE            .001                                DEFAULT
ALGO_NAME                      ALGO_SUPPORT_VECTOR_MACHINES        INPUT

関連項目

Oracle Database PL/SQLパッケージ・プロシージャおよびタイプ・リファレンス

25.3.5 Rモデルのマイニング・モデル設定の指定

Rモデルのマイニング・モデル設定によって、モデルの特性が決定されます。mining_model_tableでマイニング・モデル設定を指定できます。

ODMS_PARTITION_COLUMNS、ODMS_SAMPLINGなど、アルゴリズムを必要としない一般的な設定を組み合せることで、マイニング・モデル設定を使用してRモデルを作成できます。次の設定は、Rマイニング・モデルに対して排他的であり、Rマイニング・モデルの指定を可能にします。

関連項目

登録済Rスクリプト

25.3.5.1 ALGO_EXTENSIBLE_LANG

拡張可能アルゴリズムによりOracle Data Miningフレームワークを指定するには、ALGO_EXTENSIBLE_LANG設定を使用します。

現在、RのみがALGO_EXTENSIBLE_LANGの有効値です。ALGO_EXTENSIBLE_LANGの値がRに設定されている場合、マイニング・モデルは、R言語を使用して作成されます。model_setting_tableの次の設定を使用して、Rモデルの作成、スコアおよび表示を指定できます。

関連項目

登録済Rスクリプト

25.3.5.2 RALG_BUILD_FUNCTION

Rアルゴリズムのマイニング・モデル作成に対する、既存の登録済Rスクリプトの名前を指定するには、RALG_BUILD_FUNCTIONを使用します。

model_setting_tableでRALG_BUILD_FUNCTIONとALGO_EXTENSIBLE_LANGの両方を指定する必要があります。Rスクリプトにより、トレーニング・データに対するdata.frameの最初の入力引数を含むR関数が定義され、Rモデル・オブジェクトが戻されます。最初のデータ引数は必須です。RALG_BUILD_FUNCTIONは、追加のモデル作成パラメータを受け入れることができます。

注意:

入力パラメータの有効な入力は、数値および文字列のスカラー・データ型です。

例25-3 RALG_BUILD_FUNCTIONの例

この例は、model_setting_tableでのモデルの作成に使用されるRスクリプトMY_LM_BUILD_SCRIPTの名前の指定方法を示しています。

Begin
insert into model_setting_table values
(dbms_data_mining.ralg_build_function,'MY_LM_BUILD_SCRIPT');
End;
/

RスクリプトMY_LM_BUILD_SCRIPTにより、LMモデルを作成するR関数が定義されます。既存のOREセキュリティ制限を使用するRスクリプト・リポジトリにスクリプトMY_LM_BUILD_SCRIPTを登録する必要があります。Oracle R Enterprise API sys.rqScriptCreateを使用して、スクリプトを登録できます。Oracle R EnterpriseでRスクリプトを登録するにはRQADMINロールが必要です。

次に例を示します。

Begin
sys.rqScriptCreate('MY_LM_BUILD_SCRIPT', 'function(data, formula, model.frame) {lm(formula = formula, data=data, model = as.logical(model.frame)}');
End;
/

クラスタリングと特徴抽出のマイニング機能のモデル作成では、戻りRモデルでR属性のdm$nclusおよびdm$nfeatを設定して、クラスタと特徴の数をそれぞれ指定する必要があります。

RスクリプトMY_KM_BUILD_SCRIPTにより、クラスタリング用のk-Meansモデルを作成するR関数が定義されます。R属性dm$nclusは、戻りクラスタリング・モデル用のクラスタ数で設定されます。

'function(dat) {dat.scaled <- scale(dat)
     set.seed(6543); mod <- list()
     fit <- kmeans(dat.scaled, centers = 3L)
     mod[[1L]] <- fit
     mod[[2L]] <- attr(dat.scaled, "scaled:center")
     mod[[3L]] <- attr(dat.scaled, "scaled:scale")
     attr(mod, "dm$nclus") <- nrow(fit$centers)
     mod}'

RスクリプトMY_PCA_BUILD_SCRIPTにより、PCAモデルを作成するR関数が定義されます。R属性dm$nfeatは、戻り特徴抽出モデル用の特徴数で設定されます。

'function(dat) {
     mod <- prcomp(dat, retx = FALSE)
     attr(mod, "dm$nfeat") <- ncol(mod$rotation)
     mod}'

関連項目

25.3.5.2.1 RALG_BUILD_PARAMETER

RALG_BUILD_FUNCTION入力パラメータは、SQL SELECT問合せ文フォーマットの数値および文字列スカラー値のリストを指定します。

例25-4 RALG_BUILD_PARAMETERの例

RALG_BUILD_FUNCTION入力パラメータは、数値および文字列のスカラー値のリストである必要があります。入力パラメータはオプションです。

パラメータの構文は次のとおりです。

'SELECT value parameter name ...FROM dual'

この例は、RALG_BUILD_PARAMETERを使用して、入力引数'formula'の式、および入力引数'model.frame'の数値ゼロを指定する方法を示しています。これらの入力引数は、RALG_BUILD_FUNCTIONパラメータで使用されるRスクリプトの関数シグネチャと一致する必要があります。

Begin
insert into model_setting_table values
(dbms_data_mining.ralg_build_parameter, 'select ''AGE ~ .'' as "formula", 0 as "model.frame" from dual');
End;
/

関連項目

RALG_BUILD_FUNCTION

25.3.5.3 RALG_DETAILS_FUNCTION

RALG_DETAILS_FUNCTIONは、data.frameで戻されるRモデル・メタデータを指定します。

モデル情報を生成する、既存の登録済Rスクリプトの名前を指定するには、RALG_DETAILS_FUNCTIONを使用します。指定されたRスクリプトにより、Rモデル・オブジェクトの最初の入力引数を含むR関数が定義されます。R関数の出力はdata.frameとなる必要があります。data.frameの列は、RALG_DETAILS_FORMATによって定義され、数値または文字列スカラー型のみを含むことができます。

例25-5 RALG_DETAILS_FUNCTIONの例

この例は、model_setting_tableのRスクリプトMY_LM_DETAILS_SCRIPTの名前の指定方法を示しています。このスクリプトにより、モデル情報の提供に使用されるR関数が定義されます。

Begin
insert into model_setting_table values
(dbms_data_mining.ralg_details_function, 'MY_LM_DETAILS_SCRIPT');
End;
/

Rスクリプト・リポジトリでは、スクリプトMY_LM_DETAILS_SCRIPTは次のように登録されます。

 'function(mod) data.frame(name=names(mod$coefficients),
    coef=mod$coefficients)'

関連項目

25.3.5.3.1 RALG_DETAILS_FORMAT

モデル・ビュー内の名前および列タイプを指定するには、RALG_DETAILS_FORMATパラメータを使用します。これは、モデル・ビュー列の名前およびタイプの数値および文字列スカラー・データ型のリストを指定するSELECT問合せを含む文字列です。

RALG_DETAILS_FORMATとRALG_DETAILS_FUNCTIONの両方が指定されている場合、名前DM$VD <model_name>によるモデル・ビューが、Rモデルとともに現在のスキーマに作成されます。モデル・ビューの最初の列はPARTITION_NAMEです。パーティション化されていないモデルの場合NULL値となります。モデル・ビューの他の列は、RALG_DETATLS_FORMATによって定義されます。

例25-6 RALG_DETAILS_FORMATの例

この例は、生成されたモデル・ビューの列の名前およびタイプを指定する方法を示しています。モデル・ビューには、最初の列partition_nameの後にvarchar2列のattr_nameおよび数値列coef_valueが含まれます。

Begin
insert into model_setting_table values
(dbms_data_mining.ralg_details_format, 'select cast(''a'' as varchar2(20)) as attr_name, 0 as coef_value from dual');
End;
/

関連項目

RALG_DETAILS_FUNCTION

25.3.5.4 RALG_SCORE_FUNCTION

mining_model_tableのRアルゴリズム・マイニング・モデル・スコアの既存の登録済Rスクリプトを指定するには、RALG_SCORE_FUNCTIONを使用します。

指定したRスクリプトによりR関数が定義されます。最初の入力引数は、モデル・オブジェクトを定義します。2番目の入力引数は、データのスコアリングに使用されるdata.frameを定義します。

例25-7 RALG_SCORE_FUNCTIONの例

この例は、関数がRモデルを取得し、data.frameでデータをスコアリングする方法を示します。引数オブジェクトは、R線形モデルです。引数newdataには、data.frame内のスコアリング・データが含まれます。

function(object, newdata) {res <- predict.lm(object, newdata = newdata, se.fit = TRUE); data.frame(fit=res$fit, se=res$se.fit, df=summary(object)$df[1L])}

この例では、次のようになります

objectは、LMモデルを示します
newdataは、スコアリングdata.frameを示します

指定したR関数の出力はdata.frameとなる必要があります。各行は、入力data.frameの対応するスコアリング・データの予測を表しています。data.frameの列は、次のようにマイニング機能固有です。

回帰: 予測対象のターゲット値の単一の数値列であり、モデル適合の標準誤差および自由度の2つのオプション列があります。オプション列は、問合せ関数PREDICTION_BOUNDSが動作するために必要です。

例25-8 回帰用のRALG_SCORE_FUNCTIONの例

この例は、model_setting_tableでのモデルのスコアリングに使用されるRスクリプトMY_LM_PREDICT_SCRIPTの名前の指定方法を示しています。

Begin
insert into model_setting_table values
(dbms_data_mining.ralg_score_function, 'MY_LM_PREDICT_SCRIPT');
End;
/

Rスクリプト・リポジトリでは、スクリプトMY_LM_PREDICT_SCRIPTは次のように登録されます。

function(object, newdata) {data.frame(pre = predict(object, newdata = newdata))}

分類: 各列は、1つのターゲット・クラスの予測確率を表します。列名は、ターゲット・クラス名です。

例25-9 分類用のRALG_SCORE_FUNCTIONの例

この例は、model_setting_tableでのロジット分類モデルのスコアリングに使用されるRスクリプトMY_LOGITGLM_PREDICT_SCRIPTの名前の指定方法を示しています。

Begin
insert into model_setting_table values
(dbms_data_mining.ralg_score_function, 'MY_LOGITGLM_PREDICT_SCRIPT');
End;
/

Rスクリプト・リポジトリでは、MY_LOGITGLM_PREDICT_SCRIPTは次のように登録されます。これは、"0"と "1"の2つのターゲット・クラスを持つロジット分類です。

'function(object, newdata) {
   pred <- predict(object, newdata = newdata, type="response");
   res <- data.frame(1-pred, pred);
   names(res) <- c("0", "1");
   res}'

クラスタリング: 各列は、1つのクラスタの予測確率を表します。列は、クラスタIDの順に並べられます。各クラスタにはクラスタIDが割り当てられ、これは1から始まる連続した値です。RモデルでCLUSTER_DISTANCEをサポートするには、Rスコア・ファンクションの出力は、予測確率の列の後に、クラスタIDの順で各クラスタへの距離の値を含む追加列を戻します。

例25-10 クラスタリング用のRALG_SCORE_FUNCTIONの例

この例は、model_setting_tableでのモデルのスコアリングに使用されるRスクリプトMY_CLUSTER_PREDICT_SCRIPTの名前の指定方法を示しています。

Begin
insert into model_setting_table values
(dbms_data_mining.ralg_score_function, 'MY_CLUSTER_PREDICT_SCRIPT');
End;
/

Rスクリプト・リポジトリでは、スクリプトMY_CLUSTER_PREDICT_SCRIPTは次のように登録されます。

'function(object, dat){
     mod <- object[[1L]]; ce <- object[[2L]]; sc <- object[[3L]];
     newdata = scale(dat, center = ce, scale = sc);
     centers <- mod$centers;
     ss <- sapply(as.data.frame(t(centers)),
     function(v) rowSums(scale(newdata, center=v, scale=FALSE)^2));
     if (!is.matrix(ss)) ss <- matrix(ss, ncol=length(ss));
     disp <- -1 / (2* mod$tot.withinss/length(mod$cluster));
     distr <- exp(disp*ss);
     prob <- distr / rowSums(distr);
     as.data.frame(cbind(prob, sqrt(ss)))}'

この関数は、Rモデルからクラスタの中央値をフェッチし、スコア・データから対応するクラスタの中央値への距離に基づいて、各クラスタに属する確率を計算します。

特徴抽出: 各列は、1つの特徴の係数値を表します。列は、特徴IDの順に並べられます。各特徴には特徴IDが割り当てられ、これは1から始まる連続した値です。

例25-11 特徴抽出用のRALG_SCORE_FUNCTIONの例

この例は、model_setting_tableでのモデルのスコアリングに使用されるRスクリプトMY_FEATURE_EXTRACTION_SCRIPTの名前の指定方法を示しています。

Begin
insert into model_setting_table values
(dbms_data_mining.ralg_score_function, 'MY_FEATURE_EXTRACTION_SCRIPT');
End;
/

Rスクリプト・リポジトリでは、スクリプトMY_FEATURE_EXTRACTION_SCRIPTは次のように登録されます。

 'function(object, dat) { as.data.frame(predict(object, dat)) }'

この関数は、Rモデルから特徴の中央値をフェッチし、スコア・データから対応する特徴の中央値への距離に基づいて、特徴の係数を計算します。

関連項目

登録済Rスクリプト

25.3.5.5 RALG_WEIGHT_FUNCTION

スコアリング内の各属性の重みまたは寄与率を計算する、既存の登録済Rスクリプトの名前を指定するには、RALG_WEIGHT_FUNCTIONを使用します。指定したRスクリプトは、問合せ関数PREDICTION_DETAILSで、属性の寄与率を評価するために使用されます。

指定したRスクリプトは、モデル・オブジェクトの最初の入力引数、およびスコアリング・データのdata.frameの2番目の入力引数を含むR関数を定義します。マイニング機能が分類、クラスタリングまたは特徴抽出の場合、ターゲット・クラス名、クラスタIDまたは特徴IDが3番目の入力引数によって渡され、その特定のクラス、クラスタまたは特徴の重みが計算されます。スクリプトにより、各属性の影響を与える重みが行内に含まれるdata.frameが戻されます。各行は、その入力スコアリングdata.frameに対応しています。

例25-12 RALG_WEIGHT_FUNCTIONの例

この例は、model_setting_tableでのRモデル属性の重みまたは寄与率を計算するRスクリプトMY_PREDICT_WEIGHT_SCRIPTの名前の指定方法を示しています。

Begin
insert into model_setting_table values
(dbms_data_mining.ralg_weight_function, 'MY_PREDICT_WEIGHT_SCRIPT');
End;
/

Rスクリプト・リポジトリでは、回帰用のスクリプトMY_PREDICT_WEIGHT_SCRIPTは次のように登録されます。

'function(mod, data) { coef(mod)[-1L]*data }'

Rスクリプト・リポジトリでは、ロジット分類用のスクリプトMY_PREDICT_WEIGHT_SCRIPTは次のように登録されます。

'function(mod, dat, clas) {
   v <- predict(mod, newdata=dat, type = "response");
   v0 <- data.frame(v, 1-v); names(v0) <- c("0", "1");
   res <- data.frame(lapply(seq_along(dat),
   function(x, dat) {
   if(is.numeric(dat[[x]])) dat[,x] <- as.numeric(0)
   else dat[,x] <- as.factor(NA);
   vv <- predict(mod, newdata = dat, type = "response");
   vv = data.frame(vv, 1-vv); names(vv) <- c("0", "1");
   v0[[clas]] / vv[[clas]]}, dat = dat));
   names(res) <- names(dat);
   res}'

関連項目

登録済Rスクリプト

25.3.5.6 登録済Rスクリプト

RALG_*_FUNCTIONは、Rスクリプト・リポジトリ内に存在するRスクリプトを指定する必要があります。Rスクリプトは、Oracle R Enterpriseを使用すると登録できます。

RALG_*_FUNCTIONには、次の機能があります。

RALG_BUILD_FUNCTION
RALG_DETAILS_FUNCTION
RALG_SCORE_FUNCTION
RALG_WEIGHT_FUNCTION

注意:

Rモデルが機能するためには、RスクリプトがRスクリプト・リポジトリに存在する必要があります。

Rスクリプトは、Oracle Enterprise R (ORE)を通じて登録できます。Rスクリプトを登録するには、RQADMINロールが必要です。Rモデルを作成したら、この指定したRスクリプトの名前がモデルの設定になります。Rモデルが機能し続けるためには、このRスクリプトがRスクリプト・リポジトリに存在する必要があります。

Rモデルを作成、スコアリングおよび表示するために使用されるRメモリーも、Oracle Enterprise Rで管理できます。

25.3.5.7 Rモデルのデモ・スクリプト

rdbms/demoにあるRモデル・デモ・スクリプトにアクセスできます

dmraidemo.sql  dmrglmdemo.sql dmrpcademo.sql
dmrardemo.sql  dmrkmdemo.sql  dmrrfdemo.sql
dmrdtdemo.sql  dmrnndemo.sql

25.4 モデルの詳細ビュー

GET_*インタフェースはモデル・ビューに置き換えられるため、かわりにこのビューを利用することをお薦めします。

次に、新しいモデル・ビューを示します。

相関:

分類、回帰、異常検出:

クラスタリング:

特徴抽出:

特徴選択:

最小記述長のモデル・ディテール・ビュー

データの準備およびその他:

25.4.1 相関ルールのモデル・ディテール・ビュー

相関ルールのモデル・ディテール・ビューは、相関ルールのルール・ビューを説明しています。GET_ASSOCIATION_RULESファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

ルール・ビューDM$VRmodel_nameは、相関ルールに対して生成されたルールを説明しています。モデルの設定によって、ルールの列セットは異なります。次のビューは、トランザクショナルおよび2次元の入力に対する集計なしで異なるグローバル設定が適用されたときに表示されます。

ASSO_AGGREGATES設定のないトランザクショナル入力

ODMS_ITEM_ID_COLUMN_NAMEが設定され、ITEM_VALUE (ODMS_ITEM_VALUE_COLUMN_NAME)が設定されていない場合、トランザクショナル・ビューは次のようになります。

Name                                      Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 RULE_ID                                   NUMBER
 RULE_SUPPORT                              NUMBER
 RULE_CONFIDENCE                           NUMBER
 RULE_LIFT                                 NUMBER
 RULE_REVCONFIDENCE                        NUMBER
 ANTECEDENT_SUPPORT                        NUMBER
 NUMBER_OF_ITEMS                           NUMBER
 CONSEQUENT_SUPPORT                        NUMBER
 CONSEQUENT_NAME                           VARCHAR2(4000)
 ANTECEDENT                                SYS.XMLTYPE

表25-11 トランザクショナル入力のルール・ビュー列

列名	説明
`PARTITION_NAME`	詳細を取得するパーティション化されたモデルのパーティション
`RULE_ID`	ターゲットの名前または識別子
`RULE_SUPPORT`	ルールを満たすトランザクションの数。
`RULE_CONFIDENCE`	トランザクションがルールを満たす確度。
`RULE_LIFT`	ルールが満たされた場合に、ランダムな可能性を上回る予測の改善の程度。
`RULE_REVCONFIDENCE`	ルールが発生するトランザクションの数を後件が発生するトランザクションの数で割ったもの。
`ANTECEDENT_SUPPORT`	トランザクションの合計数に対する、前件を満たすトランザクションの数の割合。
`NUMBER_OF_ITEMS`	ルールの前件と後件で参照される属性の合計数。
`CONSEQUENT_SUPPORT`	トランザクションの合計数に対する、後件を満たすトランザクションの数の割合。
`CONSEQUENT_NAME`	後件の名前
`CONSEQUENT_SUBNAME`	2次元の入力の場合、`CONSEQUENT_SUBNAME`が、入力データ表内のネストした列に使用されます。「例: マーケット・バスケット分析用のネストした列の作成」を参照してください。この例では、ネストした列があります。`CONSEQUENT_SUBNAME`は、ネストした列の`ATTRIBUTE_NAME`部分です。つまり、`'O/S Documentation Set - English'`および`CONSEQUENT_VALUE`は、ネストした列の値部分であり、1です。 2次元入力では、`ODMS_ITEM_ID_COLUMN_NAME`が設定されていない場合、各項目は、`NAME`、`SUBNAME`および`VALUE`の3つの部分で構成されます。ビューでは、後件用に3列が使用されます。ルール・ビューには次の列があります。 `Name Type ----------------------- --------------------- PARTITION_NAME VARCHAR2(128) RULE_ID NUMBER RULE_SUPPORT NUMBER RULE_CONFIDENCE NUMBER RULE_LIFT NUMBER RULE_REVCONFIDENCE NUMBER ANTECEDENT_SUPPORT NUMBER NUMBER_OF_ITEMS NUMBER CONSEQUENT_SUPPORT NUMBER CONSEQUENT_NAME VARCHAR2(4000) CONSEQUENT_SUBNAME VARCHAR2(4000) CONSEQUENT_VALUE VARCHAR2(4000) ANTECEDENT SYS.XMLTYPE` 注意: 3つの部分のすべての型は`VARCHAR2`です。`ASSO_AGGREGATES`が設定されている場合、この列は適用されません。
`CONSEQUENT_VALUE`	`ODMS_ITEM_ID_COLUMN_NAME`が設定されていて、`Item_value` (`ODMS_ITEM_VALUE_COLUMN_NAME`)が量的の`TYPE`で設定されている場合の後件の値。ビューには、`CONSEQUENT_VALUE`列があります。次のビューでは、`CONSEQUENT_VALUE`の`TYPE`は`NUMBER`です。 `Name Type -------------------------- ----------------------- PARTITION_NAME VARCHAR2(128) RULE_ID NUMBER RULE_SUPPORT NUMBER RULE_CONFIDENCE NUMBER RULE_LIFT NUMBER RULE_REVCONFIDENCE NUMBER ANTECEDENT_SUPPORT NUMBER NUMBER_OF_ITEMS NUMBER CONSEQUENT_SUPPORT NUMBER CONSEQUENT_NAME VARCHAR2(4000) CONSEQUENT_VALUE NUMBER ANTECEDENT SYS.XMLTYPE` `ODMS_ITEM_ID_COLUMN_NAME`が設定されていて、`Item_value` (`ODMS_ITEM_VALUE_COLUMN_NAME`)が質的の`TYPE`で設定されている場合、ビューには、`CONSEQUENT_VALUE`列があります。次のビューでは、`CONSEQUENT_VALUE`の`TYPE`は`VARCHAR`です。 `Name Type ------------------- ---------------------------- PARTITION_NAME VARCHAR2(128) RULE_ID NUMBER RULE_SUPPORT NUMBER RULE_CONFIDENCE NUMBER RULE_LIFT NUMBER RULE_REVCONFIDENCE NUMBER ANTECEDENT_SUPPORT NUMBER NUMBER_OF_ITEMS NUMBER CONSEQUENT_SUPPORT NUMBER CONSEQUENT_NAME VARCHAR2(4000) CONSEQUENT_VALUE VARCHAR2(4000) ANTECEDENT SYS.XMLTYPE`
`ANTECEDENT`	ルール内の独立の条件。この条件が存在する場合は、後件に依存条件も存在します。条件は、述語(`DM_PREDICATE`)と呼ばれる属性値の組み合わせです。述語は、属性ごとの条件を指定します。条件としては、指定の値に等しい(=)、等しくない(<>)、より大(>)、より小(<)、以上(>=)、または以下(<=)を指定できます。前件の属性条件ごとに、支持度と信頼度が述語に戻されます。支持度は、前件を満たすトランザクションの数です。信頼度は、トランザクションが前件を満たす確度です。 `ANTECEDENT`には、各前件項目に対して`ITEM_VALUE` (数値型)部分も含まれます。注意: `DM_PREDICATE`属性があることは、トランザクションに項目が存在することを示しています。`attribute_num_value`または`attribute_str_value`の実際の値に意味はありません。たとえば、次の述語は、属性値がNULLでもトランザクションにMouse Padが存在していることを示しています。 `DM_PREDICATE('PROD_NAME', 'Mouse Pad', '= ', NULL, NULL, NULL, NULL))`

ASSO_AGGREGATES設定があるトランザクショナル入力

集計設定のないビューと類似しており、3つのトランザクショナル・ケースがあります。次に、ケースを示します。

ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が設定されていない場合のルール・ビュー。
ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が量的のTYPEで設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE列があります。
ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が質的のTYPEで設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE列があります。

ASSO_AGGREGATESを含むビューには、集計出力の列(集計当たり4列)があります。2次元入力では、集計設定は許可されません。

例25-13 例

次の例は、集計対象として設定されている利益と売上を示しています。

Name                                      Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 RULE_ID                                   NUMBER
 RULE_SUPPORT                              NUMBER
 RULE_CONFIDENCE                           NUMBER
 RULE_LIFT                                 NUMBER
 RULE_REVCONFIDENCE                        NUMBER
 ANTECEDENT_SUPPORT                        NUMBER
 NUMBER_OF_ITEMS                           NUMBER
 CONSEQUENT_SUPPORT                        NUMBER
 CONSEQUENT_NAME                           VARCHAR2(4000)
 ANTECEDENT                                SYS.XMLTYPE
 ANT_RULE_PROFIT                           BINARY_DOUBLE
 CON_RULE_PROFIT                           BINARY_DOUBLE
 ANT_PROFIT                                BINARY_DOUBLE
 CON_PROFIT                                BINARY_DOUBLE
 ANT_RULE_SALES                            BINARY_DOUBLE
 CON_RULE_SALES                            BINARY_DOUBLE
 ANT_SALES                                 BINARY_DOUBLE
 CON_SALES                                 BINARY_DOUBLE

ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が量的のTYPEで設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE列があります。

Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 PARTITION_NAME                                     VARCHAR2(128)
 RULE_ID                                            NUMBER
 RULE_SUPPORT                                       NUMBER
 RULE_CONFIDENCE                                    NUMBER
 RULE_LIFT                                          NUMBER
 RULE_REVCONFIDENCE                                 NUMBER
 ANTECEDENT_SUPPORT                                 NUMBER
 NUMBER_OF_ITEMS                                    NUMBER
 CONSEQUENT_SUPPORT                                 NUMBER
 CONSEQUENT_NAME                                    VARCHAR2(4000)
 CONSEQUENT_VALUE                                   NUMBER
 ANTECEDENT                                         SYS.XMLTYPE
 ANT_RULE_PROFIT                                    BINARY_DOUBLE
 CON_RULE_PROFIT                                    BINARY_DOUBLE
 ANT_PROFIT                                         BINARY_DOUBLE
 CON_PROFIT                                         BINARY_DOUBLE
 ANT_RULE_SALES                                     BINARY_DOUBLE
 CON_RULE_SALES                                     BINARY_DOUBLE
 ANT_SALES                                          BINARY_DOUBLE
 CON_SALES                                          BINARY_DOUBLE

ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が質的のTYPEで設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE列があります。

Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 PARTITION_NAME                                     VARCHAR2(128)
 RULE_ID                                            NUMBER
 RULE_SUPPORT                                       NUMBER
 RULE_CONFIDENCE                                    NUMBER
 RULE_LIFT                                          NUMBER
 RULE_REVCONFIDENCE                                 NUMBER
 ANTECEDENT_SUPPORT                                 NUMBER
 NUMBER_OF_ITEMS                                    NUMBER
 CONSEQUENT_SUPPORT                                 NUMBER
 CONSEQUENT_NAME                                    VARCHAR2(4000)
 CONSEQUENT_VALUE                                   VARCHAR2(4000)
 ANTECEDENT                                         SYS.XMLTYPE
 ANT_RULE_PROFIT                                    BINARY_DOUBLE
 CON_RULE_PROFIT                                    BINARY_DOUBLE
 ANT_PROFIT                                         BINARY_DOUBLE
 CON_PROFIT                                         BINARY_DOUBLE
 ANT_RULE_SALES                                     BINARY_DOUBLE
 CON_RULE_SALES                                     BINARY_DOUBLE
 ANT_SALES                                          BINARY_DOUBLE
 CON_SALES                                          BINARY_DOUBLE

相関ルールのグローバルな詳細

単一のグローバルな詳細は、相関モデルによって生成されます。次の表は、相関ルール・モデルに対して戻されるグローバルな詳細について説明しています。

表25-12 相関ルールのグローバルな詳細

名前	説明
`ITEMSET_COUNT`	生成された項目セットの数
`MAX_SUPPORT`	最大サポート
`NUM_ROWS`	ビルドで使用される合計行数
`RULE_COUNT`	生成されるモデル内の相関ルールの数
`TRANSACTION_COUNT`	入力データのトランザクションの数

25.4.2 高頻度項目セットのモデル・ディテール・ビュー

高頻度項目セットのモデル・ディテール・ビューは、高頻度項目セット・ビューを説明しています。GET_FREQUENT_ITEMSETSファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

高頻度項目セット・ビューDM$VImodel_nameには、次のスキーマがあります。

Name		          Type
 ------------- ------------------
 PARTITION_NAME   VARCHAR2 (128)
 ITEMSET_ID       NUMBER
 SUPPORT          NUMBER
 NUMBER_OF_ITEMS  NUMBER
 ITEMSET          SYS.XMLTYPE

表25-13 高頻度項目ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション
`ITEMSET_ID`	項目セット識別子
`SUPPORT`	項目セットのサポート
`NUMBER_OF_ITEMS`	項目セット内の項目の数
`ITEMSET`	高頻度項目セット `SYS.XMLTYPE`列項目セットの構造は、ルール・ビューの対応する前件列と同じです。

25.4.3 トランザクショナル項目セットのモデル・ディテール・ビュー

トランザクショナル項目セットのモデル・ディテール・ビューは、トランザクショナル項目セット・ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。

集計のないトランザクショナル・データのよくあるケースとして、DM$VTmodel_nameビューは、トランザクショナル形式の項目セット情報を提供します。このビューは、XML列を含むビューと比較して、一部の問合せのパフォーマンスの向上に役立ちます。トランザクショナル項目セット・ビューには次のスキーマがあります。

Name		            Type
 ----------------- -----------------
 PARTITION_NAME      VARCHAR2(128)
 ITEMSET_ID          NUMBER
 ITEM_ID             NUMBER
 SUPPORT             NUMBER
 NUMBER_OF_ITEMS     NUMBER
 ITEM_NAME           VARCHAR2(4000)

表25-14 トランザクショナル項目セット・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション
`ITEMSET_ID`	項目セット識別子
`ITEM_ID`	項目識別子
`SUPPORT`	項目セットのサポート
`NUMBER_OF_ITEMS`	項目セット内の項目の数
`ITEM_NAME`	アイテムの名前

25.4.4 トランザクショナル・ルールのモデル・ディテール・ビュー

トランザクショナル・ルールのモデル・ディテール・ビューは、トランザクショナル・ルール・ビューおよびトランザクショナル項目セット・ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。

集計のないトランザクショナル・データには、トランザクショナル・ルール・ビューDM$VAmodel_nameもあります。このビューにより、XML列を含むビューと比較して、一部の問合せのパフォーマンスの向上を図れます。トランザクショナル・ルール・ビューには次のスキーマがあります。

Name                                      Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 RULE_ID                                   NUMBER
 ANTECEDENT_PREDICATE                      VARCHAR2(4000)
 CONSEQUENT_PREDICATE                      VARCHAR2(4000)
 RULE_SUPPORT                              NUMBER
 RULE_CONFIDENCE                           NUMBER
 RULE_LIFT                                 NUMBER
 RULE_REVCONFIDENCE                        NUMBER
 RULE_ITEMSET_ID                           NUMBER
 ANTECEDENT_SUPPORT                        NUMBER
 CONSEQUENT_SUPPORT                        NUMBER
 NUMBER_OF_ITEMS                           NUMBER

表25-15 トランザクショナル・ルール・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション
`RULE_ID`	ルール識別子
`ANTECEDENT_PREDICATE`	前件項目の名前。
`CONSEQUENT_PREDICATE`	後件項目の名前
`RULE_SUPPORT`	ルールのサポート
`RULE_CONFIDENCE`	前件が含まれる場合にトランザクションがルールを満たす確度。
`RULE_LIFT`	ルールが満たされた場合に、ランダムな可能性を上回る予測の改善の程度
`RULE_REVCONFIDENCE`	ルールが発生するトランザクションの数を後件が発生するトランザクションの数で割ったもの
`RULE_ITEMSET_ID`	項目セット識別子
`ANTECEDENT_SUPPORT`	トランザクションの合計数に対する、前件を満たすトランザクションの数の割合
`CONSEQUENT_SUPPORT`	トランザクションの合計数に対する、後件を満たすトランザクションの数の割合
`NUMBER_OF_ITEMS`	ルール内の項目の数

25.4.5 分類アルゴリズムのモデル・ディテール・ビュー

分類アルゴリズムのモデル・ディテール・ビューは、すべての分類アルゴリズムに適用されるターゲット・マップ・ビューおよびスコアリング・コスト・ビューを説明しています。GET_*ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

ターゲット・マップ・ビューDM$VTmodel_nameは、分類モデルに対するターゲット分布を説明しています。このビューには次のスキーマが含まれます。

Name                                      Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 TARGET_VALUE                              NUMBER/VARCHAR2 
 TARGET_COUNT                              NUMBER
 TARGET_WEIGHT                             NUMBER

表25-16 ターゲット・マップ・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`TARGET_VALUE`	ターゲット値(量的または質的)
`TARGET_COUNT`	特定の`TARGET_VALUE`の行数
`TARGET_WEIGHT`	特定の`TARGET_VALUE`の重み

スコアリング・コスト・ビューDM$VCmodel_nameは、分類モデルに対するスコアリング・コスト・マトリックスを説明しています。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- --------------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ACTUAL_TARGET_VALUE                       NUMBER/VARCHAR2  
 PREDICTED_TARGET_VALUE                    NUMBER/VARCHAR2  
 COST                                      NUMBER

表25-17 スコアリング・コスト・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`ACTUAL_TARGET_VALUE`	有効なターゲット値
`PREDICTED_TARGET_VALUE`	予測対象ターゲット値
`COST`	実際のターゲット値と予測されたターゲット値のペアに対して関連付けられたコスト

25.4.6 ディシジョン・ツリーのモデル・ディテール・ビュー

ディシジョン・ツリーのモデル・ディテール・ビューは、分岐情報ビュー、ノード統計ビュー、ノード説明ビューおよびコスト・マトリックス・ビューを説明しています。GET_MODEL_DETAILS_XMLファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

分岐情報ビューDM$VPmodel_nameは、ディシジョン・ツリー内の各レベルのツリー階層および分岐情報を説明しています。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ---------------------------
 PARTITION_NAME                     VARCHAR2(128)
 PARENT                             NUMBER              
 SPLIT_TYPE                         VARCHAR2            
 NODE                               NUMBER              
 ATTRIBUTE_NAME                     VARCHAR2(128)       
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)      
 OPERATOR                           VARCHAR2            
 VALUE                              SYS.XMLTYPE

表25-18 分岐情報ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`PARENT`	親のノードID
`SPLIT_TYPE`	メイン分岐またはサロゲート分岐
`NODE`	ノードID
`ATTRIBUTE_NAME`	このノードを生成するために、親ノードで分岐基準として使用される属性。
`ATTRIBUTE_SUBNAME`	分岐属性のサブ名。この値は、ネストされていない列に対してはNULLです。
`OPERATOR`	分岐演算子
`VALUE`	分岐基準として使用される値。これは、`<Element>`タグを使用して記述されるXML要素です。たとえば、`<Element>Windy</Element><Element>Hot</Element>`などとなります。

ノード統計ビューDM$VImodel_nameは、個々のツリー・ノードに関連付けられている統計を説明しています。統計には、ノード内のデータのターゲット・ヒストグラムが含まれます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 NODE                               NUMBER      
 NODE_SUPPORT                       NUMBER       
 PREDICTED_TARGET_VALUE             NUMBER/VARCHAR2
 TARGET_VALUE                       NUMBER/VARCHAR2 
 TARGET_SUPPORT                     NUMBER

表25-19 ノード統計ビュー

パラメータ	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`NODE`	ノードID
`NODE_SUPPORT`	ノードに属するトレーニング・セット内のレコード数
`PREDICTED_TARGET_VALUE`	予測対象ターゲット値
`TARGET_VALUE`	トレーニング・データ内に表示されるターゲット値
`TARGET_SUPPORT`	ノードに属し、`TARGET_VALUE`列で指定されている値を持つレコード数

より高いレベルのノードの説明が、DM$VOmodel_nameビューに表示されます。DM$VOmodel_nameには、次のスキーマがあります。

ame                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 NODE                               NUMBER                
 NODE_SUPPORT                       NUMBER                
 PREDICTED_TARGET_VALUE             NUMBER/VARCHAR2       
 PARENT                             NUMBER               
 ATTRIBUTE_NAME                     VARCHAR2(128)       
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)       
 OPERATOR                           VARCHAR2             
 VALUE                              SYS.XMLTYPE

表25-20 ノードの説明ビュー

パラメータ	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`NODE`	ノードID
`NODE_SUPPORT`	ノードに属するトレーニング・セット内のレコード数
`PREDICTED_TARGET_VALUE`	予測対象ターゲット値
`PARENT`	親のID
`ATTRIBUTE_NAME`	属性名を指定します
`ATTRIBUTE_SUBNAME`	属性サブ名を指定します
`OPERATOR`	属性述語演算子 - 次の値を使用する条件演算子。 IN、=、<>、< 、>、<=および>=
`VALUE`	説明の基準として使用される値。これは、`<Element>`タグを使用して記述されるXML要素です。たとえば、`<Element>Windy</Element><Element>Hot</Element>`などとなります。

DM$VMmodel_nameビューは、ディシジョン・ツリーの作成によって使用されるコスト・マトリックスを説明しています。DM$VMmodel_nameビューには、次のスキーマがあります。

Name                                       Type
 ----------------------------------------- --------------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ACTUAL_TARGET_VALUE                       NUMBER/VARCHAR2 
 PREDICTED_TARGET_VALUE                    NUMBER/VARCHAR2 
 COST                                      NUMBER

表25-21 コスト・マトリックス・ビュー

パラメータ	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`ACTUAL_TARGET_VALUE`	有効なターゲット値
`PREDICTED_TARGET_VALUE`	予測対象ターゲット値
`COST`	実際のターゲット値と予測されたターゲット値のペアに対して関連付けられたコスト

次の表では、ディシジョン・ツリーのグローバル・ビューについて説明します。

表25-22 モデル・グローバル・ビューのディシジョン・ツリー統計情報

名前	説明
`NUM_ROWS`	ビルドで使用される合計行数

25.4.7 一般化線形モデルのモデル・ディテール・ビュー

一般化線形モデル(GLM)のモデル・ディテール・ビューは、線形およびロジスティック回帰のモデル・ディテール・ビューおよび行診断ビューを説明します。GET_MODEL_DETAILS_GLMファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

モデル・ディテール・ビューDM$VDmodel_nameは、線形回帰モデルとロジスティック回帰モデルの両方の最終モデル情報を説明しています。

線形回帰の場合、DM$VDmodel_nameには、次のスキーマがあります。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 FEATURE_EXPRESSION                 VARCHAR2(4000)
 COEFFICIENT                        BINARY_DOUBLE
 STD_ERROR                          BINARY_DOUBLE
 TEST_STATISTIC                     BINARY_DOUBLE
 P_VALUE                            BINARY_DOUBLE
 VIF                                BINARY_DOUBLE
 STD_COEFFICIENT                    BINARY_DOUBLE
 LOWER_COEFF_LIMIT                  BINARY_DOUBLE
 UPPER_COEFF_LIMIT                  BINARY_DOUBLE

ロジスティック回帰の場合、DM$VDmodel_nameには、次のスキーマがあります。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 TARGET_VALUE                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 FEATURE_EXPRESSION                 VARCHAR2(4000)
 COEFFICIENT                        BINARY_DOUBLE
 STD_ERROR                          BINARY_DOUBLE
 TEST_STATISTIC                     BINARY_DOUBLE
 P_VALUE                            BINARY_DOUBLE
 STD_COEFFICIENT                    BINARY_DOUBLE
 LOWER_COEFF_LIMIT                  BINARY_DOUBLE
 UPPER_COEFF_LIMIT                  BINARY_DOUBLE
 EXP_COEFFICIENT                    BINARY_DOUBLE
 EXP_LOWER_COEFF_LIMIT              BINARY_DOUBLE
 EXP_UPPER_COEFF_LIMIT              BINARY_DOUBLE

表25-23 線形およびロジスティック回帰モデルのモデル・ビュー

列名	説明
`PARTITION_NAME`	モデル内の特徴の名前
`TARGET_VALUE`	有効なターゲット値
`ATTRIBUTE_NAME`	サブ名がない場合は属性名、サブ名がある場合は属性名の最初の部分。`ATTRIBUTE_NAME`は、ソース表またはビューの列の名前です。列が、ネストされていない数値列の場合、`ATTRIBUTE_NAME`はマイニング属性の名前です。切片の場合、`ATTRIBUTE_NAME`はNULLです。切片は、SVMモデルのバイアスに相当する用語です。
`ATTRIBUTE_SUBNAME`	ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。ネストした列が数値の場合、マイニング属性は、`ATTRIBUTE_NAME - ATTRIBUTE_SUBNAME`の組合せによって識別されます。列がネストしていない場合、`ATTRIBUTE_SUBNAME`はNULLです。属性が切片の場合、`ATTRIBUTE_NAME`と`ATTRIBUTE_SUBNAME`の両方がNULLです。
`ATTRIBUTE_VALUE`	質的列またはネストした質的列とみなすことができる一意の値。質的列では、マイニング属性は、一意の`ATTRIBUTE_NAME.ATTRIBUTE_VALUE`のペアによって識別されます。ネストした質的列では、マイニング属性は、`ATTRIBUTE_NAME.ATTRIBUTE_SUBNAME.ATTRIBUTE_VALUE`の組合せによって識別されます。量的属性の場合、`ATTRIBUTE_VALUE`はNULLです。
`FEATURE_EXPRESSION`	特徴選択が有効な場合、アルゴリズムによって作成される特徴名です。特徴選択が有効でない場合、この特徴名は、単に完全修飾された属性名になります(属性がネストした列内にあるときはattribute_name.attribute_subnameになる)。質的属性では、次のような形式の特徴名が作成されます。 fully-qualified_attribute_name.attribute_value 特徴生成が有効な場合、モデル内の用語は、単一のマイニング属性または最大3つのマイニング属性の積となります。コンポーネント・マイニング属性は、単一の用語内で繰り返すことができます。特徴生成が有効ではない場合、または特徴生成が有効であるが、複数のコンポーネントの用語が`CREATE`モデル・プロセスによって検出されない場合、`FEATURE_EXPRESSION`はNULLになります。注意: Oracle Database 12cリリース2では、アルゴリズムによって、量的コンポーネントから平均が減算されません。
`COEFFICIENT`	推定係数。
`STD_ERROR`	係数推定値の標準誤差。
`TEST_STATISTIC`	線形回帰の場合、係数推定値のt値。ロジスティック回帰の場合、係数推定値のWaldカイ二乗値。
`P_VALUE`	モデル内の用語が統計的に重要ではない(NULL)仮定の下の`TEST_STATISTIC`の確率。低い確率は用語が重要であることを示し、高い確率は用語を破棄した方がよいことを示します。モデルの特定の属性の重要度を分析するのに使用されます。
`VIF`	分散拡大要因。切片の場合、この値はゼロです。ロジスティック回帰の場合、`VIF`はNULLです。
`STD_COEFFICIENT`	係数の標準化推定値。
`LOWER_COEFF_LIMIT`	係数の信頼限界値の下限。
`UPPER_COEFF_LIMIT`	係数の信頼限界値の上限。
`EXP_COEFFICIENT`	ロジスティック回帰の場合は指数係数線形回帰の場合、`EXP_COEFFICIENT`はNULLです。
`EXP_LOWER_COEFF_LIMIT`	ロジスティック回帰の場合、係数の信頼限界値の下限に対する指数係数。線形回帰の場合、`EXP_LOWER_COEFF_LIMIT`はNULLです。
`EXP_UPPER_COEFF_LIMIT`	ロジスティック回帰の場合、係数の信頼限界値の上限に対する指数係数。線形回帰の場合、`EXP_UPPER_COEFF_LIMIT`はNULLです。

行診断ビューDM$VAmodel_nameは、線形回帰モデルとロジスティック回帰モデルの両方の行レベル情報を説明しています。線形回帰の場合、DM$VAmodel_nameには、次のスキーマがあります。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CASE_ID                            NUMBER/VARHCAR2
 TARGET_VALUE                       BINARY_DOUBLE
 PREDICTED_TARGET_VALUE             BINARY_DOUBLE
 Hat                                BINARY_DOUBLE
 RESIDUAL                           BINARY_DOUBLE
 STD_ERR_RESIDUAL                   BINARY_DOUBLE
 STUDENTIZED_RESIDUAL               BINARY_DOUBLE
 PRED_RES                           BINARY_DOUBLE
 COOKS_D                            BINARY_DOUBLE

表25-24 線形回帰の行診断ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`CASE_ID`	ケースIDの名前
`TARGET_VALUE`	入力行から取得される実際のターゲット値
`PREDICTED_TARGET_VALUE`	行のモデル予測ターゲット値
`HAT`	ハット・マトリックスによって特定の入力行で識別されるn*n (n=行数)の対角線上の要素。入力データのモデル予測は、ハット・マトリックスと入力ターゲット値のベクターの積です。対角線上の要素(ハット値)は、i番目の適合した値上のi番目の行の影響を表します。大きいハット値は、i番目の行が影響力の大きいポイントであり、潜在的な外れ値であることを示すインジケータです。
`RESIDUAL`	特定の入力行の予測と実際のターゲット値間の差異。
`STD_ERR_RESIDUAL`	標準残余誤差(ステューデント化残差とも呼ばれる)は、入力行の残差を比較可能にするために、残差を再スケーリングしてすべての入力行にわたる定数分散を得ます。このプロセスは、残差を行の重さの平方根で乗算し、平均平方誤差の積およびハット値から1減算した値で除算します。
`STUDENTIZED_RESIDUAL`	スチューデント化削除残差は、現在の行の影響のために、標準残余誤差を調整します。
`PRED_RES`	予測残差は、削除残差の重み付きの2乗であり、行の重みを残差の2乗で乗算し、ハット値から1を減算した値で除算して算出されます。
`COOKS_D`	クックの距離は、すべての推定回帰係数上のi番目のケースの複合的影響のメジャーです。

ロジスティック回帰の場合、DM$VAmodel_nameには、次のスキーマがあります。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CASE_ID                            NUMBER/VARHCAR2
 TARGET_VALUE                       NUMBER/VARCHAR2
 TARGET_VALUE_PROB                  BINARY_DOUBLE
 Hat                                BINARY_DOUBLE
 WORKING_RESIDUAL                   BINARY_DOUBLE
 PEARSON_RESIDUAL                   BINARY_DOUBLE
 DEVIANCE_RESIDUAL                  BINARY_DOUBLE
 C                                  BINARY_DOUBLE
 CBAR                        	    BINARY_DOUBLE
 DIFDEV                             BINARY_DOUBLE
 DIFCHISQ                           BINARY_DOUBLE

表25-25 ロジスティック回帰の行診断ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`CASE_ID`	ケースIDの名前
`TARGET_VALUE`	入力行から取得される実際のターゲット値
`TARGET_VALUE_PROB`	予測ターゲット値の確率のモデル推定値。
`Hat`	線形回帰のハット値の概念は、線形回帰ハッチ値をロジスティック回帰の分散関数で乗算することでロジスティック回帰に拡張され、予測確率は、予測確率から1を減算した値で乗算されます。
`WORKING_RESIDUAL`	作業残差は、作業応答の残差です。作業応答は、線形化スケール上の応答です。ロジスティック回帰の場合、i番目の行の残差がi番目の行の予測の分散で除算される形式となります。予測の分散は、予測確率を予測確率から1を減算した値で乗算し算出されます。 `WORKING_RESIDUAL`は、作業応答と収束時の線形予測子間の差異です。
`PEARSON_RESIDUAL`	ピアソン残差は、重みを考慮した、作業残差の再スケーリングされたバージョンです。ロジスティック回帰の場合、ピアソン残差は、残差を、重み平方根として計算される係数で乗算し、i番目の行の予測確率の分散で除算し算出されます。 `RESIDUAL`は、行の実際のターゲット値の予測確率から1を減算した値です。
`DEVIANCE_RESIDUAL`	`DEVIANCE_RESIDUAL`は、i番目の観測のモデル逸脱度への寄与率です。ロジスティック回帰では、非参照クラスの場合、2の平方根×`log(1 + e^eta) - eta`の形式となり、参照クラスの場合2の平方根×`log (1 + eta)`となり、この場合の`eta`は線形予測(モデルが線形回帰とする場合の予測)です。
`C`	削除されたもの(i番目のポイント)を含む、すべてのポイントに対するi番目の観察の削除による、適合ロジット内の変更全体を測定します。これは、ピアソン残差の2乗をハット値で乗算し、ハット値から1減算した値の2乗で除算して算出されます。個々の観察による影響のスカラー測定を提供する、信頼区間の置換診断。
`CBAR`	`C`および`CBAR`は、ロジスティック回帰のクックの距離の拡張です。`CBAR`は、削除されたもの(i番目のポイント)を除く、すべてのポイントに対するi番目の観察の削除による、適合ロジット内の変更全体を測定します。これは、ピアソン残差の2乗をハット値で乗算し、(ハット値から1減算した値)で除算して算出されます。個々の観察の削除による影響を測定する、信頼区間の置換診断。
`DIFDEV`	観測値が入力から削除されたときに発生する逸脱度の変化を測定する統計。逸脱度残差の2乗に`CBAR`を加算して算出されます。
`DIFCHISQ`	観測値が入力から削除されたときに発生するピアソンのカイ二乗の変化を測定する統計。`CBAR`をハット値で除算して算出されます。

GLMのグローバルな詳細: 線形回帰

次の表は、線形回帰モデルによって戻されるグローバルな詳細について説明しています。

表25-26 線形回帰のグローバルな詳細

名前	説明
`ADJUSTED_R_SQUARE`	調整済R2乗
`AIC`	赤池情報量基準
`COEFF_VAR`	変動の係数
`CONVERGED`	モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。 `YES` `NO`
`CORRECTED_TOTAL_DF`	修正された総自由度。
`CORRECTED_TOT_SS`	修正された総平方和。
`DEPENDENT_MEAN`	依存平均
`ERROR_DF`	誤差の自由度。
`ERROR_MEAN_SQUARE`	誤差平均平方
`ERROR_SUM_SQUARES`	誤差の平方和。
`F_VALUE`	モデルのF値の統計。
`GMSEP`	予測の推定平均平方誤差。多変量正規性を想定しています。
`HOCKING_SP`	HockingのSp統計
`ITERATIONS`	SGD反復数を追跡します。ソルバーがSGDの場合にのみ適用できます。
`J_P`	JP統計(最終予測誤差)。
`MODEL_DF`	モデルの自由度。
`MODEL_F_P_VALUE`	モデルのF値の確率。
`MODEL_MEAN_SQUARE`	モデルの平均平方誤差
`MODEL_SUM_SQUARES`	モデルの平方和誤差
`NUM_PARAMS`	パラメータ数(切片を含む係数の数)。
`NUM_ROWS`	行数
`R_SQ`	R2乗
`RANK_DEFICIENCY`	多重共線性のためにモデルから除外された予測子の数
`ROOT_MEAN_SQ`	2乗平均平方根誤差。
`SBIC`	Schwarzのベイズ情報量基準。

GLMのグローバルな詳細: ロジスティック回帰

次の表は、ロジスティック回帰モデルによって戻されるグローバルな詳細を示しています。

表25-27 ロジスティック回帰のグローバルな詳細

名前	説明
`AIC_INTERCEPT`	切片のみのベースライン・モデルの適合度に関する赤池の基準
`AIC_MODEL`	切片および共変量(予測子)モデルの適合度に関する赤池の基準。
`CONVERGED`	モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。 `YES` `NO`
`DEPENDENT_MEAN`	依存平均
`ITERATIONS`	SGD反復数(IRLS反復数)を追跡します。ソルバーがSGDの場合にのみ適用できます。
`LR_DF`	尤度比の自由度。
`LR_CHI_SQ`	尤度比のカイ二乗値。
`LR_CHI_SQ_P_VALUE`	尤度比のカイ二乗確率値。
`NEG2_LL_INTERCEPT`	切片のみのベースライン・モデルの-2対数尤度
`NEG2_LL_MODEL`	モデルの-2対数尤度。
`NUM_PARAMS`	パラメータ数(切片を含む係数の数)。
`NUM_ROWS`	行数
`PCT_CORRECT`	正確な予測の割合。
`PCT_INCORRECT`	不正確に予測された行の割合。
`PCT_TIED`	両方のターゲット・クラスの推定確率が等しくなる割合
`PSEUDO_R_SQ_CS`	擬似R二乗(CoxおよびSnell)
`PSEUDO_R_SQ_N`	擬似R2乗(Nagelkerke)
`RANK_DEFICIENCY`	多重共線性のためにモデルから除外された予測子の数
`SC_INTERCEPT`	切片のみのベースライン・モデルの適合度に関するシュワルツの基準
`SC_MODEL`	切片および共変量(予測子)モデルの適合度に関するSchwarzの基準。

注意:

「リッジ回帰」が有効な場合、戻されるグローバルな詳細がより少なくなります。リッジの詳細は、『Oracle Data Mining概要』を参照してください。
パーティション化されたモデルで値がNULLの場合、例外がスローされます。値がNULLでない場合、目的のパーティション名が含まれる必要があります。

関連項目

グローバル情報のモデル・ディテール・ビュー

25.4.8 Naive Bayesのモデル・ディテール・ビュー

Naive Bayesのモデル・ディテール・ビューは、事前のビューおよび結果ビューを説明しています。GET_MODEL_DETAILS_NBファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

事前ビューDM$VPmodel_nameは、Naïve Bayesに対するターゲットの事前の状態を説明しています。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 TARGET_NAME                               VARCHAR2(128)
 TARGET_VALUE                              NUMBER/VARCHAR2
 PRIOR_PROBABILITY                         BINARY_DOUBLE
 COUNT                                     NUMBER

表25-28 Naive Bayesの事前ビュー

列名	説明
`PARTITION_NAME`	モデル内の特徴の名前
`TARGET_NAME`	ターゲット列の名前
`TARGET_VALUE`	ターゲット値(量的または質的)
`PRIOR_PROBABILITY`	特定の`TARGET_VALUE`の事前確率
`COUNT`	特定の`TARGET_VALUE`の行数

Naïve Bayes結果ビューDM$VVmodel_viewは、Naïve Bayesモデルの条件付き確率を説明しています。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 TARGET_NAME                               VARCHAR2(128)
 TARGET_VALUE                              NUMBER/VARCHAR2
 ATTRIBUTE_NAME                            VARCHAR2(128)
 ATTRIBUTE_SUBNAME                         VARCHAR2(4000)
 ATTRIBUTE_VALUE                           VARCHAR2(4000)
 CONDITIONAL_PROBABILITY                   BINARY_DOUBLE
 COUNT                                     NUMBER

表25-29 Naive Bayesの結果ビュー

列名	説明
`PARTITION_NAME`	モデル内の特徴の名前
`TARGET_NAME`	ターゲット列の名前
`TARGET_VALUE`	ターゲット値(量的または質的)
`ATTRIBUTE_NAME`	列名
`ATTRIBUTE_SUBNAME`	ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。
`ATTRIBUTE_VALUE`	列`ATTRIBUTE_NAME`のマイニング属性値またはネストした列`ATTRIBUTE_SUBNAME` (存在する場合)。
`CONDITIONAL_PROBABILITY`	特定のターゲットのマイニング属性の条件付き確率
`COUNT`	特定のマイニング属性および特定のターゲットの行数

次の表は、Naive Bayesのグローバル・ビューについて説明しています。

表25-30 モデル・グローバル・ビューのNaive Bayes統計情報

名前	説明
`NUM_ROWS`	ビルドで使用される合計行数

25.4.9 サポート・ベクター・マシンのモデル・ディテール・ビュー

サポート・ベクター・マシンのモデル・ディテール・ビューは、線形係数ビューを説明しています。GET_MODEL_DETAILS_SVMファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

線形係数ビューDM$VLmodel_nameは、線形SVMアルゴリズムの係数を説明しています。ビューのtarget_valueフィールドは分類にのみ存在し、ターゲットの型を持ちます。回帰モデルにはtarget_valueフィールドがありません。

reversed_coefficientフィールドは、自動データ準備変換を元に戻した後の係数の値が表示されます。データ準備が無効な場合、coefficientとreversed_coefficientの値は同じになります。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- --------------------------------
 PARTITION_NAME                            VARCHAR2(128)
 TARGET_VALUE                              NUMBER/VARCHAR2
 ATTRIBUTE_NAME                            VARCHAR2(128)
 ATTRIBUTE_SUBNAME                         VARCHAR2(4000)
 ATTRIBUTE_VALUE                           VARCHAR2(4000)
 COEFFICIENT                               BINARY_DOUBLE
 REVERSED_COEFFICIENT                      BINARY_DOUBLE

表25-31 サポート・ベクター・マシンの線形係数ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`TARGET_VALUE`	ターゲット値(量的または質的)
`ATTRIBUTE_NAME`	列名
`ATTRIBUTE_SUBNAME`	ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。
`ATTRIBUTE_VALUE`	質的属性の値
`COEFFICIENT`	予測係数値
`REVERSED_COEFFICIENT`	元のスケールで変換された係数

次の表は、サポート・ベクター統計グローバル・ビューを説明しています。

表25-32モデル・グローバル・ビューのサポート・ベクター統計情報

名前	説明
`CONVERGED`	モデル作成プロセスが指定された許容値に収束したかどうかを示します。 `YES` `NO`
`ITERATIONS`	作成中の反復回数
`NUM_ROWS`	作成で使用される行の数
`REMOVED_ROWS_ZERO_NORM`	標準が0のために削除された行の数。このことは、1つのクラスの線形モデルにのみ適用されます。

25.4.10 クラスタリング・アルゴリズムのモデル・ディテール・ビュー

Oracle Data Miningは、期待値最大化、k-Meansおよび直交パーティショニング・クラスタリング(O-Cluster)などのクラスタリング・アルゴリズムをサポートしています。

すべてのクラスタリング・アルゴリズムで、次のビューが共有されます。

クラスタ説明DM$VDmodel_name
属性統計DM$VAmodel_name
ヒストグラム統計DM$VHmodel_name
ルール統計DM$VRmodel_name

クラスタ説明ビューDM$VDmodel_nameは、クラスタリング・モデルのクラスタ・レベル情報を説明しています。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 CLUSTER_NAME                       NUMBER/VARCHAR2  
 RECORD_COUNT                       NUMBER
 PARENT                             NUMBER           
 TREE_LEVEL                         NUMBER           
 LEFT_CHILD_ID                      NUMBER           
 RIGHT_CHILD_ID                     NUMBER

表25-33 クラスタリング・アルゴリズムのクラスタ説明ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`CLUSTER_ID`	モデル内のクラスタのID
`CLUSTER_NAME`	クラスタのラベルを指定します
`RECORD_COUNT`	レコードの数を指定します。
`PARENT`	親のID
`TREE_LEVEL`	ルートからの分岐の数を指定します。
`LEFT_CHILD_ID`	分岐の左側の子クラスタのID
`RIGHT_CHILD_ID`	分岐の右側の子クラスタのID

属性ビューDM$VAmodel_nameは、クラスタリング・モデルの属性レベル情報を説明しています。特定のクラスタの平均、分散およびモードの値は、このビューから取得できます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 CLUSTER_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 MEAN                               BINARY_DOUBLE
 VARIANCE                           BINARY_DOUBLE
 MODE_VALUE                         VARCHAR2(4000)

表25-34 クラスタリング・アルゴリズムの属性ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション
`CLUSTER_ID`	モデル内のクラスタのID
`CLUSTER_NAME`	クラスタのラベルを指定します
`ATTRIBUTE_NAME`	属性名を指定します
`ATTRIBUTE_SUBNAME`	属性サブ名を指定します
`MEAN`	このフィールドにより、数値属性の平均値が戻されます
`VARIANCE`	数値属性の分散
`MODE_VALUE`	モードとは、質的属性の最頻値です。

ヒストグラム・ビューDM$VHmodel_nameは、クラスタリング・モデルのヒストグラム・レベル情報を説明しています。ビン情報およびビン数は、このビューから取得できます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 CLUSTER_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 BIN_ID                             NUMBER
 LOWER_BIN_BOUNDARY                 BINARY_DOUBLE                
 UPPER_BIN_BOUNDARY                 BINARY_DOUBLE         
 ATTRIBUTE_VALUE                    VARCHAR2(4000)       
 COUNT                              NUMBER

表25-35 クラスタリング・アルゴリズムのヒストグラム・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション
`CLUSTER_ID`	モデル内のクラスタのID
`CLUSTER_NAME`	クラスタのラベルを指定します
`ATTRIBUTE_NAME`	属性名を指定します
`ATTRIBUTE_SUBNAME`	属性サブ名を指定します
`BIN_ID`	ビンID
`LOWER_BIN_BOUNDARY`	量的ビンの下限
`UPPER_BIN_BOUNDARY`	量的ビンの上限
`ATTRIBUTE_VALUE`	質的属性値
`COUNT`	ヒストグラム数

ルール・ビューDM$VRmodel_nameは、クラスタリング・モデルのルール・レベル情報を説明しています。情報は、属性の述語レベルで提供されます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER              
 CLUSTER_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 OPERATOR                           VARCHAR2(2)         
 NUMERIC_VALUE                      NUMBER              
 ATTRIBUTE_VALUE                    VARCHAR2(4000)      
 SUPPORT                            NUMBER              
 CONFIDENCE                         BINARY_DOUBLE       
 RULE_SUPPORT                       NUMBER              
 RULE_CONFIDENCE                    BINARY_DOUBLE

表25-36 クラスタリング・アルゴリズムのルール・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション
`CLUSTER_ID`	モデル内のクラスタのID
`CLUSTER_NAME`	クラスタのラベルを指定します
`ATTRIBUTE_NAME`	属性名を指定します
`ATTRIBUTE_SUBNAME`	属性サブ名を指定します
`OPERATOR`	属性述語演算子 - 次の値を使用する条件付き演算子: IN、=、<>、<、>、<=および>=
`NUMERIC_VALUE`	量的ビンの下限
`ATTRIBUTE_VALUE`	質的属性値
`SUPPORT`	属性述語のサポート
`CONFIDENCE`	属性述語の信頼度
`RULE_SUPPORT`	ルール・レベルのサポート
`RULE_CONFIDENCE`	ルール・レベルの信頼度

25.4.11 期待値最大化のモデル・ディテール・ビュー

期待値最大化(EM)のモデル・ディテール・ビューは、クラスタリング・ビューのそれに対するEMのビューにおける差異を説明しています。GET_MODEL_DETAILS_EMファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

次のビューは、クラスタリング・ビューに対する期待値最大化のビューの相違点を示しています。様々なクラスタリング・ビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。

コンポーネント・ビューDM$VOmodel_nameは、EMコンポーネントを説明しています。コンポーネント・ビューには、事前確率およびマップ先のクラスタに関する情報が含まれています。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 COMPONENT_ID                       NUMBER
 CLUSTER_ID                         NUMBER
 PRIOR_PROBABILITY                  BINARY_DOUBLE

表25-37 コンポーネント・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`COMPONENT_ID`	コンポーネントの一意の識別子
`CLUSTER_ID`	モデル内のクラスタのID
`PRIOR_PROBABILITY`	コンポーネント事前確率

平均および分散コンポーネント・ビューDM$VMmodel_nameは、ガウス分布モデル別の属性の平均および分散パラメータに関する情報を提供します。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 COMPONENT_ID                       NUMBER
 ATTRIBUTE_NAME                     VARCHAR2(4000)
 MEAN                               BINARY_DOUBLE
 VARIANCE                           BINARY_DOUBLE

頻度コンポーネント・ビューDM$VFmodel_nameは、EMモデルによって使用される複数値ベルヌーイ分布のパラメータに関する情報を提供します。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 COMPONENT_ID                       NUMBER
 ATTRIBUTE_NAME                     VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 FREQUENCY                          BINARY_DOUBLE

表25-38 頻度コンポーネント・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`COMPONENT_ID`	コンポーネントの一意の識別子
`ATTRIBUTE_NAME`	列名
`ATTRIBUTE_VALUE`	質的属性値
`FREQUENCY`	`ATTRIBUTE_NAME`および`ATTRIBUTE_VALUE`によって指定されている属性/値の組合せの複数値ベルヌーイ分散の頻度。

2次元列の場合、EMは属性評価の属性ランク付けと類似したものを提供します。このランク付けは、列のペアに対して計算されたカルバック・ライブラー・ダイバージェンスにわたる、ランクで重み付けされた平均に基づきます。この監視なし属性評価は、DM$VImodel_nameビューに表示され、次のスキーマを含みます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ATTRIBUTE_NAME                            VARCHAR2(128)
 ATTRIBUTE_IMPORTANCE_VALUE                BINARY_DOUBLE
 ATTRIBUTE_RANK                            NUMBER

表25-39 期待値最大化の2次元属性ランク付け

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`ATTRIBUTE_NAME`	列名
`ATTRIBUTE_IMPORTANCE_VALUE`	評価の値
`ATTRIBUTE_RANK`	評価の値に基づく属性ランク

pairwiseカルバック・ライブラー・ダイバージェンスは、DM$VBmodel_nameビューにレポートされます。このメトリックは、観察対象の2つの属性の結合分布が、独立性の仮定の下に、予想される分布とどの程度異なっているかを評価します。つまり、値が大きいほど、2つの属性がより依存していることになります。独立性の値は、各ペアワイズ計算に使用されるグリッドのサイズに基づいてスケーリングされます。このため、[0; 1]範囲内の全ての値が比較可能になります。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ATTRIBUTE_NAME_1                          VARCHAR2(128)
 ATTRIBUTE_NAME_2                          VARCHAR2(128)
 DEPENDENCY                                BINARY_DOUBLE

表25-40 期待値最大化のカルバック・ライブラー・ダイバージェンス

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`ATTRIBUTE_NAME_1`	属性1の名前
`ATTRIBUTE_NAME_2`	属性2の名前
`DEPENDENCY`	スケーリングされたペアワイズ・カルバック・ライブラー・ダイバージェンス

予測表DM$VPmodel_nameは、ネストした列をより下の次元空間にマップするために、ランダム予測によって使用される係数を示します。このビューには、作成データ内にネストしたデータまたはテキスト・データが存在する場合のみ行が含まれます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 FEATURE_NAME                       VARCHAR2(4000)
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 COEFFICIENT                        NUMBER

表25-41 期待値の最大化の予測表

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`FEATURE_NAME`	特徴の名前
`ATTRIBUTE_NAME`	列名
`ATTRIBUTE_SUBNAME`	ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。
`ATTRIBUTE_VALUE`	質的属性値
`COEFFICIENT`	予測係数。データ表現はまばらなため、ゼロ以外の係数のみが戻されます。

期待値の最大化のグローバルな詳細

次の表は、期待値の最大化のグローバルな詳細について説明しています。

表25-42 期待値の最大化のグローバルな詳細

名前	説明
`CONVERGED`	モデル作成プロセスが指定された許容値に収束したかどうかを示します。可能な値は次のとおりです: `YES` `NO`
`LOGLIKELIHOOD`	作成データの対数尤度
`NUM_COMPONENTS`	モデルで生成されるコンポーネントの数
`NUM_CLUSTERS`	モデルで生成されるクラスタの数
`NUM_ROWS`	作成で使用される行の数
`RANDOM_SEED`	モデル作成で使用される乱数シード値
`REMOVED_COMPONENTS`	モデルから除外する空のコンポーネントの数

関連項目

クラスタリング・アルゴリズムのモデル・ディテール・ビュー

25.4.12 k-Meansのモデル・ディテール・ビュー

k-Means (KM)のモデル・ディテール・ビューは、クラスタの説明ビューおよびスコアリング・ビューを説明しています。GET_MODEL_DETAILS_KMファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

この項では、クラスタリング・ビューに対するk-Meansのビュー内の相違点を説明しています。様々なビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。k-Meansの場合、クラスタの説明ビューDM$VDmodel_nameには、追加の列があります。

Name                                Type
 ---------------------------------- ----------------------------
 DISPERSION                         BINARY_DOUBLE

表25-43 k-Meansのクラスタの説明

列名	説明
`DISPERSION`	標準の統計モデルと比較して、一連の確認された出現が分散しているかどうかを定量化するために使用されるメジャー。

スコアリング・ビューDM$VCmodel_nameは、各リーフ・クラスタの重心を説明しています。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 CLUSTER_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 VALUE                              BINARY_DOUBLE

表25-44 k-Meansのスコアリング・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`CLUSTER_ID`	モデル内のクラスタのID
`CLUSTER_NAME`	クラスタのラベルを指定します
`ATTRIBUTE_NAME`	列名
`ATTRIBUTE_SUBNAME`	ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。
`ATTRIBUTE_VALUE`	質的属性値
`VALUE`	重心の値を指定します

次の表は、k–Meansのグローバル・ビューについて説明しています。

表25-45 モデル・グローバル・ビューのk–Means統計情報

名前	説明
`CONVERGED`	モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。 `YES` `NO`
`NUM_ROWS`	作成で使用される行の数
`REMOVED_ROWS_ZERO_NORM`	標準が0のために削除された行の数。このことは、コサイン距離を使用するモデルにのみ適用されます。

関連項目

クラスタリング・アルゴリズムのモデル・ディテール・ビュー

25.4.13 O-Clusterのモデル・ディテール・ビュー

O-Clusterのモデル・ディテール・ビューは、統計ビューを説明しています。GET_MODEL_DETAILS_OCファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

次は、クラスタリング・ビューに対するO-Clusterのビューの相違点を示しています。様々なクラスタリング・ビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。OCアルゴリズムでは、期待値最大化(EM)およびk-Means (KM)と同じ記述統計ビューが使用されます。次に統計ビューを示します。

クラスタ説明DM$VDmodel_name
属性統計DM$VAmodel_name
ルール統計DM$VRmodel_name
ヒストグラム統計DM$VHmodel_name

クラスタ説明ビューDM$VDmodel_nameは、O-Clusterコンポーネントを説明しています。クラスタ説明ビューには、分岐述語を示す追加フィールドがあります。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 OPERATOR                           VARCHAR2(2)        
 VALUE                              SYS.XMLTYPE

表25-46 説明ビュー

列名	説明
`ATTRIBUTE_NAME`	列名
`ATTRIBUTE_SUBNAME`	ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。
`OPERATOR`	分岐演算子
`VALUE`	分岐値のリスト

SYS.XMLTYPEの構造は、次のとおりです。

<Element>splitval1</Element>

OCアルゴリズムでは、ヒストグラム・ビューDM$VHmodel_nameが、EMおよびk-Means (KM)とは異なるスキーマとともに使用されます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITON_NAME                      VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 BIN_ID                             NUMBER
 LABEL                              VARCHAR2(4000)   
 COUNT                              NUMBER

表25-47 ヒストグラム・コンポーネント・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`CLUSTER_ID`	コンポーネントの一意の識別子
`ATTRIBUTE_NAME`	列名
`ATTRIBUTE_SUBNAME`	ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。
`BIN_ID`	一意の識別子
`LABEL`	ビン・ラベル
`COUNT`	ビン・ヒストグラム数

次の表は、O-Clusterのグローバル・ビューについて説明しています。

表25-48 モデル・グローバル・ビューのO-Cluster統計情報

名前	説明
`NUM_ROWS`	ビルドで使用される合計行数

関連項目

クラスタリング・アルゴリズムのモデル・ディテール・ビュー

25.4.14 明示的セマンティック分析のモデル・ディテール・ビュー

明示的セマンティック分析(ESA)のモデル・ディテール・ビューは、属性統計ビューおよび特徴ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。

ESAアルゴリズムには、次の記述統計ビューがあります。

属性統計DM$VAmodel_name
特徴DM$VFmodel_name

ビューDM$VAmodel_nameには、次のスキーマがあります。

PARTITION_NAME                      VARCHAR2(128)
 FEATURE_ID                         NUMBER/VARCHAR2 
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 COEFFICIENT                        BINARY_DOUBLE

表25-49 明示的セマンティック分析の属性ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`FEATURE_ID`	トレーニング・データに表示される特徴の一意の識別子
`ATTRIBUTE_NAME`	列名
`ATTRIBUTE_SUBNAME`	ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。
`ATTRIBUTE_VALUE`	質的属性値
`COEFFICIENT`	特徴に関する属性の重みのメジャー

ビューDM$VFmodel_nameには、1つのビュー内のすべての特徴に対して一意の行があります。この特徴は、モデルが事前作成されていて、ソース・トレーニング・データが使用不可の場合に役立ちます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 FEATURE_ID                         NUMBER/VARCHAR2

表25-50 明示的セマンティック分析の特徴ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`FEATURE_ID`	トレーニング・データに表示される特徴の一意の識別子

次の表は、明示的セマンティック分析のグローバル・ビューについて説明しています。

表25-51 モデル・グローバル・ビューの明示的セマンティック分析統計情報

名前	説明
`NUM_ROWS`	入力行の合計数
`REMOVED_ROWS_BY_FILTERS`	フィルタによって削除された行の数

25.4.15 Non-Negative Matrix Factorizationのモデル・ディテール・ビュー

Non-Negative Matrix Factorization (NMF)のモデル・ディテール・ビューは、エンコーディングHマトリックス・ビューおよびH逆マトリックス・ビューを説明しています。GET_MODEL_DETAILS_NMFファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

NMFアルゴリズムには、2つのマトリックス・コンテンツ・ビューがあります。

エンコーディング(H)マトリックスDM$VEmodel_name
H逆マトリックスDM$VImodel_name

ビューDM$VEmodel_nameは、NMFモデルのエンコーディング(H)マトリックスを説明しています。FEATURE_NAME列の型は、NUMBERまたはVARCHAR2のいずれかです。このビューには次のスキーマ定義が含まれます。

 Name		     Type
 ------------------- --------------------------
 PARTITION_NAME       VARCHAR2(128)
 FEATURE_ID           NUMBER
 FEATURE_NAME         NUMBER/VARCHAR2
 ATTRIBUTE_NAME       VARCHAR2(128)
 ATTRIBUTE_SUBNAME    VARCHAR2(4000)
 ATTRIBUTE_VALUE      VARCHAR2(4000)
 COEFFICIENT          BINARY_DOUBLE

表25-52 Non-Negative Matrix FactorizationのエンコーディングHマトリックス・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`FEATURE_ID`	モデル内の特徴のID
`FEATURE_NAME`	モデル内の特徴の名前
`ATTRIBUTE_NAME`	列名
`ATTRIBUTE_SUBNAME`	ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。
`ATTRIBUTE_VALUE`	属性の値を指定します
`COEFFICIENT`	特徴への寄与率を表す属性エンコーディング

ビューDM$VImodel_viewは、NMFモデルの逆Hマトリックスを説明しています。FEATURE_NAME列の型は、NUMBERまたはVARCHAR2のいずれかです。このビューには次のスキーマが含まれます。

 Name	           Type
 ----------------- ------------------------
 PARTITION_NAME     VARCHAR2(128)
 FEATURE_ID         NUMBER
 FEATURE_NAME       NUMBER/VARCHAR2
 ATTRIBUTE_NAME     VARCHAR2(128)
 ATTRIBUTE_SUBNAME  VARCHAR2(4000)
 ATTRIBUTE_VALUE    VARCHAR2(4000)
 COEFFICIENT        BINARY_DOUBLE

表25-53 Non-Negative Matrix Factorizationの逆Hマトリックス・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`FEATURE_ID`	モデル内の特徴のID
`FEATURE_NAME`	モデル内の特徴の名前
`ATTRIBUTE_NAME`	列名
`ATTRIBUTE_SUBNAME`	ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。
`ATTRIBUTE_VALUE`	属性の値を指定します
`COEFFICIENT`	特徴への寄与率を表す属性エンコーディング

次の表は、Non-Negative Matrix Factorizationのグローバル統計について説明しています。

表25-54 モデル・グローバル・ビューのNon-Negative Matrix Factorization統計情報

名前	説明
`CONV_ERROR`	収束エラー
`CONVERGED`	モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。 `YES` `NO`
`ITERATIONS`	作成中の反復回数
`NUM_ROWS`	ビルド入力データセットで使用される行の数
`SAMPLE_SIZE`	ビルドで使用される行の数

25.4.16 特異値分解のモデル・ディテール・ビュー

特異値分解(SVD)のモデル・ディテール・ビューは、Sマトリックス・ビュー、右特異ベクター・ビューおよび左特異ベクター・ビューを説明しています。GET_MODEL_DETAILS_SVDファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

DM$VEmodel_nameは、SVDモデル内の各特異値には、関連付けられている主成分分析(PCA)モデル内に対応する主成分があるという事実を利用して、両方のモデル・クラスの共通情報セットを関連付けます。SVDモデルの場合、Sマトリックスのコンテンツを説明します。PCAスコアリングが作成設定として選択されている場合、対応する主成分の分散値および累積分散率も表示されます。このビューには次のスキーマが含まれます。

 Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 FEATURE_ID                         NUMBER
 FEATURE_NAME                       NUMBER/VARCHAR2
 VALUE                              BINARY_DOUBLE
 VARIANCE                           BINARY_DOUBLE  
 PCT_CUM_VARIANCE                   BINARY_DOUBLE

表25-55 Sマトリックス・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`FEATURE_ID`	モデル内の特徴のID
`FEATURE_NAME`	モデル内の特徴の名前
`VALUE`	マトリックスの入力値
`VARIANCE`	コンポーネントに記述された分散値。この列は、`dbms_data_mining.svds_scoring_mode`が`dbms_data_mining.svds_scoring_pca`に設定されているSVDにのみ存在しますこの列は、手動で、または`dbms_data_mining.prep_auto`の`dbms_data_mining.prep_auto_on`への設定により、作成データが中央にある場合のみNull以外になります。
`PCT_CUM_VARIANCE`	コンポーネントに記述された分散の累積率。コンポーネントは、記述した分散値に従って降順でランク付けされます。この列は、`dbms_data_mining.svds_scoring_mode`が`dbms_data_mining.svds_scoring_pca`に設定されているSVDにのみ存在しますこの列は、手動で、または`dbms_data_mining.prep_auto`の`dbms_data_mining.prep_auto_on`への設定により、作成データが中央にある場合のみNull以外になります。

SVD DM$VVmodel_viewは、SVDモデルの右特異ベクターを説明しています。PCAモデルの場合、主成分(固有ベクター)を説明しています。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 FEATURE_ID                         NUMBER
 FEATURE_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 VALUE                              BINARY_DOUBLE

表25-56 特異値分解の右特異ベクター

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`FEATURE_ID`	モデル内の特徴のID
`FEATURE_NAME`	モデル内の特徴の名前
`ATTRIBUTE_NAME`	列名
`ATTRIBUTE_SUBNAME`	ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。
`ATTRIBUTE_VALUE`	質的属性値。量的属性の場合、`ATTRIBUTE_VALUE`はNULLです。
`VALUE`	マトリックスの入力値

ビューDM$VUmodel_nameは、SVDモデルの左特異ベクターを説明しています。PCAモデルの場合、主成分内のデータの予測を説明しています。このビューは、設定dbms_data_mining.svds_u_matrix_outputがdbms_data_mining.svds_u_matrix_enableに設定されていない場合、存在しません。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CASE_ID                            NUMBER/VARHCAR2
 FEATURE_ID                         NUMBER
 FEATURE_NAME                       NUMBER/VARCHAR2
 VALUE                              BINARY_DOUBLE

表25-57 特異値分解の左特異ベクターまたは主成分内の予測データ

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`CASE_ID`	U マトリックス予測によって記述される作成データ内にある、一意の行識別子。
`FEATURE_ID`	モデル内の特徴のID
`FEATURE_NAME`	モデル内の特徴の名前
`VALUE`	マトリックスの入力値

特異値分解のグローバルな詳細

次の表は、特異値分解のグローバルな詳細について説明しています。

表25-58 特異値分解のグローバルな詳細

名前	説明
`NUM_COMPONENTS`	モデルで生成される特徴(コンポーネント)の数
`NUM_ROWS`	ビルドで使用される合計行数
`SUGGESTED_CUTOFF`	モデルの分散値のほとんどが、計算された上位何個の特徴で取得されているかを示す推奨カットオフ。このカットオフ値よりも少ない数の特徴を使用することが、次元削減における有効な方策です。

関連項目

Oracle Database PL/SQLパッケージ・プロシージャおよびタイプ・リファレンス

25.4.17 最小記述長のモデル・ディテール・ビュー

最小記述長(属性評価の計算用)のモデル・ディテール・ビューは、属性評価ビューを説明しています。GET_MODEL_DETAILS_AIファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

属性評価ビューDM$VAmodel_nameは、属性評価および属性評価ランクについて説明しています。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ATTRIBUTE_NAME                            VARCHAR2(128)
 ATTRIBUTE_SUBNAME                         VARCHAR2(4000)
 ATTRIBUTE_IMPORTANCE_VALUE                BINARY_DOUBLE
 ATTRIBUTE_RANK                            NUMBER

表25-59 最小記述長の属性評価ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`ATTRIBUTE_NAME`	列名
`ATTRIBUTE_SUBNAME`	ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。
`ATTRIBUTE_IMPORTANCE_VALUE`	評価の値
`ATTRIBUTE_RANK`	評価に基づくランク

次の表では、最小記述長のグローバル・ビューについて説明します。

表25-60 モデル・グローバル・ビューの最小記述長統計情報

名前	説明
`NUM_ROWS`	ビルドで使用される合計行数

25.4.18 ビニングのモデル・ディテール・ビュー

ビニング・ビューDM$VBは、自動データ準備で使用されるビン境界を説明しています。

このビューには次のスキーマが含まれます。

Name                                Type
 --------------------       --------------------
 PARTITION_NAME                     VARCHAR2(128)
 ATTRIBUTE_NAME                     VARCHAR2(128)   
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)  
 BIN_ID                             NUMBER           
 LOWER_BIN_BOUNDARY                 BINARY_DOUBLE          
 UPPER_BIN_BOUNDARY                 BINARY_DOUBLE   
 ATTRIBUTE_VALUE                    VARCHAR2(4000)

表25-61 ビニングのモデル・ディテール・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`ATTRIBUTE_NAME`	属性名を指定します
`ATTRIBUTE_SUBNAME`	属性サブ名を指定します
`BIN_ID`	ビンID (またはビン識別子)
`LOWER_BIN_BOUNDARY`	量的ビンの下限
`UPPER_BIN_BOUNDARY`	量的ビンの上限
`ATTRIBUTE_VALUE`	質的値

25.4.19 グローバル情報のモデル・ディテール・ビュー

グローバル情報のモデル・ディテール・ビューは、グローバル統計ビュー、アラート・ビューおよび計算済設定ビューを説明しています。GET_MODEL_DETAILS_GLOBALファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

グローバル統計ビューDM$VGmodel_nameは、モデル作成に関連するグローバル統計について説明しています。例として、作成に使用される行数、コンバージェンス・ステータスおよびモデルの質メトリックがあります。このビューには次のスキーマが含まれます。

Name                                Type
 -------------------         --------------------
 PARTITION_NAME                     VARCHAR2(128)
 NAME                               VARCHAR2(30)     
 NUMERIC_VALUE                      NUMBER           
 STRING_VALUE                       VARCHAR2(4000)

表25-62 グローバル統計ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`NAME`	統計の名前
`NUMERIC_VALUE`	統計の量的値
`STRING_VALUE`	統計の質的値

アラート・ビューDM$VWmodel_nameは、モデルの作成中に発行されたアラートをリストします。このビューには次のスキーマが含まれます。

Name                                Type
 -------------------       ----------------------
 PARTITION_NAME                     VARCHAR2(128)
 ERROR_NUMBER                       BINARY_DOUBLE
 ERROR_TEXT                         VARCHAR2(4000)

表25-63 アラート・ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`ERROR_NUMBER`	エラー番号(イベントがエラーのとき有効)
`ERROR_TEXT`	エラー・メッセージ

計算済設定ビューDM$VSmodel_nameは、アルゴリズムの計算済設定を示します。このビューには次のスキーマが含まれます。

Name                                Type
 -----------------          --------------------
 PARTITION_NAME                     VARCHAR2(128)
 SETTING_NAME                       VARCHAR2(30)
 SETTING_VALUE                      VARCHAR2(4000)

表25-64 計算済設定ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション名
`SETTING_NAME`	設定の名前
`SETTING_VALUE`	設定の値

25.4.20 正規化および欠損値の処理のモデル・ディテール・ビュー

正規化および欠損値の処理ビューDM$VNは、自動データ準備(ADP)で使用される正規化パラメータ、およびNULL値が発生したときの欠損値の置換を説明しています。欠損値の置換は、2次元の列にのみ適用され、ネストされた列には適用されません。

このビューには次のスキーマが含まれます。

Name                                Type
 ----------------------       -----------------------
 PARTITION_NAME                     VARCHAR2(128)
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 NUMERIC_MISSING_VALUE              BINARY_DOUBLE  
 CATEGORICAL_MISSING_VALUE          VARCHAR2(4000)  
 NORMALIZATION_SHIFT                BINARY_DOUBLE   
 NORMALIZATION_SCALE                BINARY_DOUBLE

表25-65 正規化および欠損値の処理ビュー

列名	説明
`PARTITION_NAME`	パーティション化されたモデルのパーティション
`ATTRIBUTE_NAME`	列名
`ATTRIBUTE_SUBNAME`	ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。
`NUMERIC_MISSING_VALUE`	量的欠損値の置換
`CATEGORICAL_MISSING_VALUE`	質的欠損値の置換
`NORMALIZATION_SHIFT`	正規化シフト値
`NORMALIZATION_SCALE`	正規化スケール値