25 モデルの作成

データ・マイニング・モデルを作成し、モデルの詳細を問い合せる方法について説明します。

25.1 モデルを作成する前の作業

モデルを作成する前に必要とされる準備手順について説明します。

モデルは、データ・マイニングを実行するデータベース・スキーマ・オブジェクトです。DBMS_DATA_MINING PL/SQLパッケージは、マイニング・モデル(モデルの詳細)の作成、構成、評価および問合せを行うAPIです。

モデルを作成する前に、そのモデルで実行する処理を決定する必要があります。トレーニング・データを特定し、変換が必要かどうかを判断する必要があります。モデルの設定を指定して、モデルの動作に影響を与えることができます。次の表は、準備の手順をまとめたものです。

表25-1 マイニング・モデルを作成する準備

準備手順 説明

マイニング機能の選択

「マイニング機能の選択」を参照

アルゴリズムの選択

「アルゴリズムの選択」を参照

作成(トレーニング)データの特定

「データの準備」を参照

テスト・データの特定(分類モデルの場合)

「分類および回帰用のデータ・セット」を参照

データ変換の方針の決定

「データの変換」を参照

設定表の作成と移入(必要な場合)

「モデルの設定の指定」を参照

25.2 CREATE_MODELプロシージャ

DBMS_DATA_MININGパッケージのCREATE_MODELプロシージャは、指定されたデータを使用して、指定された名前およびマイニング機能を持つマイニング・モデルを作成します。モデルは、構成設定とユーザー指定の変換を使用して作成できます。

PROCEDURE CREATE_MODEL(
                  model_name            IN VARCHAR2,
                  mining_function       IN VARCHAR2,
                  data_table_name       IN VARCHAR2,
                  case_id_column_name   IN VARCHAR2,
                  target_column_name    IN VARCHAR2 DEFAULT NULL,
                  settings_table_name   IN VARCHAR2 DEFAULT NULL,
                  data_schema_name      IN VARCHAR2 DEFAULT NULL,
                  settings_schema_name  IN VARCHAR2 DEFAULT NULL,
                  xform_list            IN TRANSFORM_LIST DEFAULT NULL);

25.2.1 マイニング機能の選択

CREATE_MODELへのマイニング機能の提供について説明します。

マイニング機能は、CREATE_MODELプロシージャに必須の引数です。データ・マイニング機能によって、モデル化や解決の対象となり得る問題のクラスが特定されます。

データ・マイニング機能は、監視あり学習または監視なし学習のいずれかを実装しています。監視あり学習では、独立属性のセットを使用して従属属性の値またはターゲットを予測します。監視なし学習では従属属性と独立属性は区別されません。監視あり機能は予測的です。監視なし機能は記述的です。

注意:

データ・マイニングの用語では、機能(function)とは、特定のデータ・マイニング・アプローチを使用して解決される問題の一般的な種類です。SQL言語の用語では、関数(function)は値を戻す演算子です。

Oracle Data Miningのドキュメントでは、機能(function)またはマイニング機能(mining function)という用語は、データ・マイニング機能を表し、SQL関数(SQL function)またはSQLデータ・マイニング関数(SQL Data Mining function)という用語は、スコアリング(データ・マイニング・モデルの適用)用のSQL関数を表します。

CREATE_MODELmining_functionパラメータに指定できる値を次の表に示します。

表25-2 マイニング・モデルの機能

Mining_Functionの値 説明

ASSOCIATION

相関は、記述マイニング機能の一種です。相関モデルによって、データ・セット内に存在する関係とその発生確率が識別されます(相関ルール)。

相関モデルではAprioriアルゴリズムが使用される。

ATTRIBUTE_IMPORTANCE

属性評価(Attribute Importance)は、予測マイニング機能の一種。属性評価モデルは、特定の結果を予測する中で属性の相対的な重要度を識別する。

属性評価モデルでは、最小記述長アルゴリズムが使用される。

CLASSIFICATION

分類(Classification)は、予測マイニング機能の一種。分類モデルは、履歴データを使用して質的ターゲットを予測する。

分類モデルでは、Naive Bayes、ディシジョン・ツリー、ロジスティック回帰またはサポート・ベクター・マシンが使用される。デフォルトはNaive Bayes。

分類機能は、異常検出にも使用可能。この場合、ターゲットがNULLであるSVMアルゴリズムが使用される(1クラスSVM)。

CLUSTERING

クラスタリングは、記述マイニング機能の一種です。クラスタリング・モデルは、データセットの中で自然なグループを識別する。

クラスタリング・モデルでは、k-Means、O-Clusterまたは期待値最大化が使用される。デフォルトはk-Means。

FEATURE_EXTRACTION

特徴抽出(Feature Extraction)は、記述マイニング機能の一種。特徴抽出モデルは、最適化された属性のセットを作成する。

特徴抽出モデルでは、Non-Negative Matrix Factorization、特異値分解(主成分分析にも使用可能)または明示的セマンティック分析が使用される。デフォルトはNon-Negative Matrix Factorization。

REGRESSION

回帰(Regression)は、予測マイニング機能の一種。回帰モデルは、履歴データを使用して量的ターゲットを予測する。

回帰モデルでは、サポート・ベクター・マシンまたは線形回帰が使用される。デフォルトはサポート・ベクター・マシン。

25.2.2 アルゴリズムの選択

モデルのアルゴリズム設定の指定について説明します。

ALGO_NAME設定では、モデルのアルゴリズムを指定できます。マイニング機能に対してデフォルトのアルゴリズムを使用する場合、または使用できるアルゴリズムが1つしかない場合は、ALGO_NAME設定を指定する必要はありません。モデルの設定を指定する手順については、「モデルの設定の指定」を参照してください。

表25-3 データ・マイニングのアルゴリズム

ALGO_NAMEの値 アルゴリズム デフォルトかどうか マイニング・モデルの機能

ALGO_AI_MDL

最小記述

属性評価

ALGO_APRIORI_ASSOCIATION_RULES

Apriori

相関

ALGO_DECISION_TREE

ディシジョン・ツリー

分類

ALGO_EXPECTATION_MAXIMIZATION

期待値最大化

ALGO_EXPLICIT_SEMANTIC_ANALYS

明示的セマンティック分析

特徴抽出

ALGO_EXTENSIBLE_LANG 拡張可能アルゴリズムで使用される言語

すべてのマイニング機能がサポートされています

ALGO_GENERALIZED_LINEAR_MODEL

一般化線形モデル

分類、回帰

ALGO_KMEANS

k-Means

デフォルト

クラスタリング

ALGO_NAIVE_BAYES

Naive Bayes

デフォルト

分類

ALGO_NONNEGATIVE_MATRIX_FACTOR

Non-Negative Matrix Factorization

デフォルト

特徴抽出

ALGO_O_CLUSTER

O-Cluster

クラスタリング

ALGO_SINGULAR_VALUE_DECOMP

特異値分解(主成分分析にも使用可能)

特徴抽出

ALGO_SUPPORT_VECTOR_MACHINES

サポート・ベクター・マシン

デフォルト

デフォルトの回帰アルゴリズム

回帰、分類、異常検出(ターゲットのない分類)

25.2.3 変換の指定

必要に応じて、CREATE_MODELxform_listパラメータで作成データに対する変換を指定できます。変換の指示がモデル内に組み込まれ、新しいデータへのモデルの適用時には常にその変換指示が再適用されます。

25.2.3.1 変換リストの作成

変換リストを作成する方法は次のとおりです。

  • DBMS_DATA_MINING_TRANSFORMSTACKインタフェース。

    STACKインタフェースは、属性または属性のグループに適用可能な事前定義された変換のセットを提供します。たとえば、すべての質的属性に対して監視ありビニングを指定することができます。

  • DBMS_DATA_MINING_TRANSFORMSET_TRANSFORMプロシージャ。

    SET_TRANSFORMプロシージャは、指定されたSQL式を指定された属性に適用します。たとえば、次の文では、country_idの変換指示を、my_xformsという変換リストに追加します。変換指示は、アルゴリズムの処理が開始される前にcountry_idを10で割ります。逆変換はcountry_idに10を掛けます。

      dbms_data_mining_transform.SET_TRANSFORM (my_xforms,
         'country_id', NULL, 'country_id/10', 'country_id*10');
    

    逆変換はモデルの詳細で適用されます。country_idが監視ありモデルのターゲットである場合、逆変換はスコアリングされるターゲットにも適用されます。

25.2.3.2 変換リストおよび自動データ準備

変換リストと自動データ準備(ADP)間の相互作用について理解します。

CREATE_MODELに対する変換リスト引数は、自動データ準備(ADP)を制御するPREP_AUTO設定と次のように相互作用します。

  • ADPが有効で、変換リストを指定した場合、ユーザー指定の変換は自動変換とともに適用されてモデルに組み込まれます。指定した変換は、自動変換の前に実行されます。

  • ADPが無効で、変換リストを指定した場合、ユーザー指定の変換が適用されてモデルに組み込まれますが、システム生成の変換は実行されません。

  • ADPが有効で、変換リストを指定しなかった場合、システム生成の変換が適用されてモデルに組み込まれます。

  • ADPが無効で、変換リストも指定しなかった場合、変換はモデルに組み込まれません。モデルの作成、テストおよびスコアリングに使用するデータセットは別個に準備する必要があります。

25.2.4 パーティション化されたモデルについて

Oracle Data Miningは、永続的なOracle Data Miningのパーティション化されたモデルの作成をサポートしています。パーティション化されたモデルでは、複数のモデルが単一のモデル・エンティティ内のパーティションとして編成され表されるため、ユーザーは独立したデータのスライスに合せてモデルを簡単に作成し管理できます。

永続的とは、パーティション化されたモデルがディスク上の表現を持つことを意味します。この製品は、パーティション化されたモデルの編成を管理し、パーティション化モデルのスコアリング・プロセスを簡素化します。スコアリング時、USING句の一部としてパーティション列を含める必要があります。

パーティション化されたモデルのパーティション名、キー値および構造は、ALL_MINING_MODEL_PARTITIONSビューに表示されます。

関連項目:

25.2.4.1 パーティション化されたモデルの作成プロセス

Oracle Data Miningでパーティション化されたモデルを作成するには、パーティション化キーが必要です。パーティション・キーは、設定表の作成設定を通じて設定します。

パーティション化キーとは、入力データ・セットからの1つ以上列(最大16)で構成されるカンマ区切りリストです。パーティション化キーは、パーティション化キーの離散値に基づいて、入力データを水平方向にスライスします。つまり、パーティション化は、連続した値に対する範囲のパーティション化とは対照的に、リスト値として実行されます。パーティション化キーは、NUMBERおよびVARCHAR2のデータ型の列のみをサポートしています。

作成プロセス中、入力データ・セットは、指定されたキーの個別値に基づいてパーティション化されます。各データ・スライス(一意のキー値)が、その独自のモデル・パーティションとなります。結果として作成されるモデル・パーティションは分かれておらず、スタンドアロン・モデルとして表示されません。パーティション化されたモデルのパーティションの最大数のデフォルト値は、1000パーティションです。異なるパーティション値を設定することもできます。入力データ・セットのパーティション数が、定義された最大数を超えている場合、Oracle Data Miningによって例外がスローされます。

パーティション化されたモデルでは、すべてのパーティションに共通の特徴、およびパーティション固有の特徴が編成されます。共通の特徴は、次のメタデータで構成されます。

  • モデル名

  • マイニング機能

  • マイニング・アルゴリズム

  • すべてのパーティションによって参照される全マイニング・モデル属性のスーパー・セット(シグネチャ)

  • ユーザー定義列変換の共通セット

  • グローバルと解釈されるユーザー指定またはデフォルトの作成設定。たとえば、自動データ準備(ADP)設定など

25.2.4.2 パーティション化されたモデル内のDDL
パーティション化されたモデルは、次のDDL操作を通じて管理されます。
25.2.4.2.1 モデルの削除またはパーティションの削除

Oracle Data Miningは、特定のパーティション名の単一のモデル・パーティションの削除をサポートしています。

1つのパーティションしか残っていない場合、そのパーティションを明示的に削除することはできません。かわりに、そのパーティションを削除する前に別のパーティションを追加するか、モデル自体の削除を選択できます。パーティション化されたモデルを削除する場合、すべてのパーティションは、単一のアトミック操作で削除されます。パフォーマンスの観点から、DROP_PARTITIONオプションは効率的に動作するため、REPLACEオプションを使用するのではなく、DROP_PARTITIONADD_PARTITIONの順に実行することをお薦めします。

25.2.4.2.2 パーティションの追加

Oracle Data Miningは、単一のパーティションまたは複数のパーティションの既存のパーティション化されたモデルへの追加をサポートしています。

追加は、入力データ・セットおよび既存のパーティション化されたモデルの名前に基づいて発生します。操作は、入力データ・セットおよび既存のパーティション化されたモデルをパラメータとして使用します。パーティション・キーは、入力データ・セットから抽出され、モデル・パーティションは入力データ・セットに対して作成されます。このパーティションは、パーティション化されたモデルとして追加されます。新規パーティションのパーティション・キーがモデル内の既存パーティションと競合する場合、次の3つの手法から選択して競合を解決できます。

  • ERROR: パーティションを追加することなくADD操作を終了します。

  • REPLACE: 競合するキーが検出された既存のパーティションを置き換えます。

  • IGNORE: 競合するキーがある行を排除します。

入力データ・セットに複数のキーが含まれている場合、複数のパーティションが作成されます。モデル内のパーティションの合計数が、モデルの作成時に指定したユーザー定義最大数を超えると、エラーが発生します。パーティション数のデフォルトしきい値は1000です。

25.2.4.3 パーティション化されたモデルのスコアリング

パーティション化されたモデルのスコアリングについて説明します。

パーティション化されたモデルのスコアリングは、パーティション化されていないモデルのそれと同じです。データ・マイニング機能の構文は同じですが、オプションのヒントを提供するように拡張されています。オプションのヒントは、パーティション化されたモデルのスコアリングを含む問合せのパフォーマンスに影響を及ぼす可能性があります。

パーティション化されたモデルのスコアリングでは、パーティショニング・キーの作成中に使用されるシグネチャ列が、スコアリング・データセットに存在している必要があります。この列は、一意のパーティション・キーを形成するために組合されます。この一意のキーは、特定の基底となるモデル・パーティションにマップされ、識別されたモデル・パーティションがその行のスコアリングに使用されます。

スコアリングに必要なパーティション化オブジェクトが、問合せの実行時にオンデマンドでロードされ、システム・グローバル領域(SGA)メモリーに応じて有効期限が切れます。

25.3 モデルの設定の指定

データ・マイニング・モデルの作成時の構成方法について理解します。

データ・マイニング・モデルは、作成時に多数の構成設定を使用して構成できます。設定を指定するには、次の表に示す列を持つ設定表を作成し、その表をCREATE_MODELに渡します。

表25-4 設定表に必要な列

列名 データ型

setting_name

VARCHAR2(30)

setting_value

VARCHAR2(4000)

例25-1では、サポート・ベクター・マシン(SVM)分類モデルの設定表が作成されます。SVMはデフォルトの分類機能ではないため、ALGO_NAME設定を使用してこのアルゴリズムを指定します。SVMS_KERNEL_FUNCTIONSVMS_LINEARに設定することにより、モデルは線形カーネルを使用して作成されます。カーネル関数を指定しない場合、アルゴリズムがデータの属性の数に基づいてカーネルを選択します。

通常はモデルに適用される設定と、アルゴリズムに固有の設定があります。モデルの設定は表25-5および表25-6を参照してください。

表25-5 一般的なモデルの設定

設定 説明

マイニング機能の設定

『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』マイニング機能の設定に関する説明を参照

アルゴリズムの名前

『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』アルゴリズム名に関する説明を参照

グローバルなモデルの特性

『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』グローバルな設定に関する説明を参照

自動データ準備

『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』自動データ準備に関する説明を参照

表25-6 アルゴリズム固有のモデルの設定

アルゴリズム 説明

ディシジョン・ツリー

『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』アルゴリズムの設定: ディシジョン・ツリーに関する説明を参照

期待値最大化

『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』アルゴリズムの設定: 期待値最大化に関する説明を参照

明示的セマンティック分析

『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』アルゴリズム設定: 明示的セマンティック分析に関する説明を参照

一般化線形モデル

『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』アルゴリズムの設定: 一般化線形モデルに関する説明を参照

k-Means

『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』アルゴリズムの設定: k-Meansに関する説明を参照

Naive Bayes

『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』アルゴリズムの設定: Naive Bayesに関する説明を参照

Non-Negative Matrix Factorization

『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』アルゴリズムの設定: Non-Negative Matrix Factorizationに関する説明を参照

O-Cluster

『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: O-Clusterに関する説明を参照

特異値分解

『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: 特異値分解に関する説明を参照

サポート・ベクター・マシン

『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: サポート・ベクター・マシンに関する説明を参照

例25-1 SVM分類モデルの設定表の作成

CREATE TABLE svmc_sh_sample_settings (
  setting_name VARCHAR2(30),
  setting_value VARCHAR2(4000));

BEGIN 
  INSERT INTO svmc_sh_sample_settings (setting_name, setting_value) VALUES
    (dbms_data_mining.algo_name, dbms_data_mining.algo_support_vector_machines);
  INSERT INTO svmc_sh_sample_settings (setting_name, setting_value) VALUES
    (dbms_data_mining.svms_kernel_function, dbms_data_mining.svms_linear);
  COMMIT;
END;
/

25.3.1 コストの指定

ディシジョン・ツリー・モデルを作成するためのコスト・マトリックスを指定します。

CLAS_COST_TABLE_NAME設定は、ディシジョン・ツリー・モデルの作成に使用するコスト・マトリックス表の名前を指定します。コスト・マトリックスは、分類モデルにバイアスをかけて、コストのかかる分類ミスを最小化します。コスト・マトリックス表には、次の表に示す列が必要です。

表25-7 コスト・マトリックス表に必要な列

列名 データ型

actual_target_value

有効なターゲット・データ型

predicted_target_value

有効なターゲット・データ型

cost

NUMBER

ディシジョン・ツリーは、作成時にコスト・マトリックスを指定できる唯一のアルゴリズムです。ただし、スコアリングの際には、どの分類モデルにもコスト・マトリックスを作成して関連付けることができます。

スコアリングにコストを使用する場合は、表25-7に示す列を持つ表を作成し、DBMS_DATA_MINING.ADD_COST_MATRIXプロシージャを使用してコスト・マトリックス表をモデルに追加します。PREDICTION関数を呼び出すときに、コスト・マトリックスをインラインで指定することもできます。表23-1で、有効なターゲット・データ型の詳細を示しています。

25.3.2 事前確率の指定

事前確率は、作成データと実際の母集団の間の分布の差を埋めるために使用されます。

CLAS_PRIORS_TABLE_NAME設定は、Naive Bayesモデルの作成に使用する事前確率表の名前を指定します。事前表には、次の表に示す列が必要です。

表25-8 事前確率表に必要な列

列名 データ型

target_value

有効なターゲット・データ型

prior_probability

NUMBER

25.3.3 クラスに対する重みの指定

より高い重み付けのクラスを優先するには、ロジスティック回帰またはサポート・ベクター・マシン(SVM)分類でクラス重み表設定を指定します。

CLAS_WEIGHTS_TABLE_NAME設定は、より高い重み付けのクラスを優先するようにロジスティック回帰(一般化線形モデル分類)またはSVM分類のモデルにバイアスをかけるために使用する、クラスの重み表の名前を指定します。重み表には、次の表に示す列が必要です。

表25-9 クラスの重みの表に必要な列

列名 データ型

target_value

有効なターゲット・データ型

class_weight

NUMBER

25.3.4 データ・ディクショナリにおけるモデルの設定

データ・ディクショナリ・ビューのALL/USER/DBA_MINING_MODEL_SETTINGSについて説明します。

マイニング・モデルの設定に関する情報は、データ・ディクショナリ・ビューALL/USER/DBA_MINING_MODEL_SETTINGSから取得できます。ALL接頭辞を使用した場合、このビューは、現在のユーザーがアクセスできるモデルの設定に関する情報を戻します。USER接頭辞を使用した場合は、ユーザー・スキーマ内のモデルの設定に関する情報を戻します。DBA接頭辞を使用できるのはDBAのみです。

ALL_MINING_MODEL_SETTINGSの列は次のとおりです。各列の説明は、次の表を参照してください

SQL> describe all_mining_model_settings
 Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 OWNER                                     NOT NULL VARCHAR2(30)
 MODEL_NAME                                NOT NULL VARCHAR2(30)
 SETTING_NAME                              NOT NULL VARCHAR2(30)
 SETTING_VALUE                                      VARCHAR2(4000)
 SETTING_TYPE                                       VARCHAR2(7)

表25-10 ALL_MINING_MODEL_SETTINGS

説明

owner

マイニング・モデルの所有者。

model_name

マイニング・モデルの名前。

setting_name

設定の名前。

setting_value

設定の値。

setting_type

INPUT: 値がユーザーによって指定される場合。DEFAULT: 値がシステムによって生成される場合。

次の問合せは、サポート・ベクター・マシン(SVM)の分類モデルSVMC_SH_CLAS_SAMPLEの設定をリストします。ALGO_NAMECLAS_WEIGHTS_TABLE_NAMEおよびSVMS_KERNEL_FUNCTIONの設定はユーザーが指定しています。これらの設定は、モデルの設定表で指定されています。

例25-2 ALL_MINING_MODEL_SETTINGS

SQL> COLUMN setting_value FORMAT A35
SQL> SELECT setting_name, setting_value, setting_type
            FROM all_mining_model_settings
            WHERE model_name in 'SVMC_SH_CLAS_SAMPLE';
 
SETTING_NAME                   SETTING_VALUE                       SETTING
------------------------------ ----------------------------------- -------
SVMS_ACTIVE_LEARNING           SVMS_AL_ENABLE                      DEFAULT
PREP_AUTO                      OFF                                 DEFAULT
SVMS_COMPLEXITY_FACTOR         0.244212                            DEFAULT
SVMS_KERNEL_FUNCTION           SVMS_LINEAR                         INPUT
CLAS_WEIGHTS_TABLE_NAME        svmc_sh_sample_class_wt             INPUT
SVMS_CONV_TOLERANCE            .001                                DEFAULT
ALGO_NAME                      ALGO_SUPPORT_VECTOR_MACHINES        INPUT

25.3.5 Rモデルのマイニング・モデル設定の指定

Rモデルのマイニング・モデル設定によって、モデルの特性が決定されます。mining_model_tableでマイニング・モデル設定を指定できます。

ODMS_PARTITION_COLUMNSODMS_SAMPLINGなど、アルゴリズムを必要としない一般的な設定を組み合せることで、マイニング・モデル設定を使用してRモデルを作成できます。次の設定は、Rマイニング・モデルに対して排他的であり、Rマイニング・モデルの指定を可能にします。
25.3.5.1 ALGO_EXTENSIBLE_LANG

拡張可能アルゴリズムによりOracle Data Miningフレームワークを指定するには、ALGO_EXTENSIBLE_LANG設定を使用します。

現在、RのみがALGO_EXTENSIBLE_LANGの有効値です。ALGO_EXTENSIBLE_LANGの値がRに設定されている場合、マイニング・モデルは、R言語を使用して作成されます。model_setting_tableの次の設定を使用して、Rモデルの作成、スコアおよび表示を指定できます。

25.3.5.2 RALG_BUILD_FUNCTION

Rアルゴリズムのマイニング・モデル作成に対する、既存の登録済Rスクリプトの名前を指定するには、RALG_BUILD_FUNCTIONを使用します。

model_setting_tableRALG_BUILD_FUNCTIONALGO_EXTENSIBLE_LANGの両方を指定する必要があります。Rスクリプトにより、トレーニング・データに対するdata.frameの最初の入力引数を含むR関数が定義され、Rモデル・オブジェクトが戻されます。最初のデータ引数は必須です。RALG_BUILD_FUNCTIONは、追加のモデル作成パラメータを受け入れることができます。

注意:

入力パラメータの有効な入力は、数値および文字列のスカラー・データ型です。

例25-3 RALG_BUILD_FUNCTIONの例

この例は、model_setting_tableでのモデルの作成に使用されるRスクリプトMY_LM_BUILD_SCRIPTの名前の指定方法を示しています。

Begin
insert into model_setting_table values
(dbms_data_mining.ralg_build_function,'MY_LM_BUILD_SCRIPT');
End;
/ 

RスクリプトMY_LM_BUILD_SCRIPTにより、LMモデルを作成するR関数が定義されます。既存のOREセキュリティ制限を使用するRスクリプト・リポジトリにスクリプトMY_LM_BUILD_SCRIPTを登録する必要があります。Oracle R Enterprise API sys.rqScriptCreateを使用して、スクリプトを登録できます。Oracle R EnterpriseでRスクリプトを登録するにはRQADMINロールが必要です。

次に例を示します。

Begin
sys.rqScriptCreate('MY_LM_BUILD_SCRIPT', 'function(data, formula, model.frame) {lm(formula = formula, data=data, model = as.logical(model.frame)}');
End;
/

クラスタリングと特徴抽出のマイニング機能のモデル作成では、戻りRモデルでR属性のdm$nclusおよびdm$nfeatを設定して、クラスタと特徴の数をそれぞれ指定する必要があります。

RスクリプトMY_KM_BUILD_SCRIPTにより、クラスタリング用のk-Meansモデルを作成するR関数が定義されます。R属性dm$nclusは、戻りクラスタリング・モデル用のクラスタ数で設定されます。

'function(dat) {dat.scaled <- scale(dat)
     set.seed(6543); mod <- list()
     fit <- kmeans(dat.scaled, centers = 3L)
     mod[[1L]] <- fit
     mod[[2L]] <- attr(dat.scaled, "scaled:center")
     mod[[3L]] <- attr(dat.scaled, "scaled:scale")
     attr(mod, "dm$nclus") <- nrow(fit$centers)
     mod}'

RスクリプトMY_PCA_BUILD_SCRIPTにより、PCAモデルを作成するR関数が定義されます。R属性dm$nfeatは、戻り特徴抽出モデル用の特徴数で設定されます。

'function(dat) {
     mod <- prcomp(dat, retx = FALSE)
     attr(mod, "dm$nfeat") <- ncol(mod$rotation)
     mod}'
25.3.5.2.1 RALG_BUILD_PARAMETER

RALG_BUILD_FUNCTION入力パラメータは、SQL SELECT問合せ文フォーマットの数値および文字列スカラー値のリストを指定します。

例25-4 RALG_BUILD_PARAMETERの例

RALG_BUILD_FUNCTION入力パラメータは、数値および文字列のスカラー値のリストである必要があります。入力パラメータはオプションです。

パラメータの構文は次のとおりです。
'SELECT value parameter name ...FROM dual'
この例は、RALG_BUILD_PARAMETERを使用して、入力引数'formula'の式、および入力引数'model.frame'の数値ゼロを指定する方法を示しています。これらの入力引数は、RALG_BUILD_FUNCTIONパラメータで使用されるRスクリプトの関数シグネチャと一致する必要があります。
Begin
insert into model_setting_table values
(dbms_data_mining.ralg_build_parameter, 'select ''AGE ~ .'' as "formula", 0 as "model.frame" from dual');
End;
/

関連項目

25.3.5.3 RALG_DETAILS_FUNCTION

RALG_DETAILS_FUNCTIONは、data.frameで戻されるRモデル・メタデータを指定します。

モデル情報を生成する、既存の登録済Rスクリプトの名前を指定するには、RALG_DETAILS_FUNCTIONを使用します。指定されたRスクリプトにより、Rモデル・オブジェクトの最初の入力引数を含むR関数が定義されます。R関数の出力はdata.frameとなる必要があります。data.frameの列は、RALG_DETAILS_FORMATによって定義され、数値または文字列スカラー型のみを含むことができます。

例25-5 RALG_DETAILS_FUNCTIONの例

この例は、model_setting_tableのRスクリプトMY_LM_DETAILS_SCRIPTの名前の指定方法を示しています。このスクリプトにより、モデル情報の提供に使用されるR関数が定義されます。
Begin
insert into model_setting_table values
(dbms_data_mining.ralg_details_function, 'MY_LM_DETAILS_SCRIPT');
End;
/
Rスクリプト・リポジトリでは、スクリプトMY_LM_DETAILS_SCRIPTは次のように登録されます。
 'function(mod) data.frame(name=names(mod$coefficients),
    coef=mod$coefficients)'
25.3.5.3.1 RALG_DETAILS_FORMAT

モデル・ビュー内の名前および列タイプを指定するには、RALG_DETAILS_FORMATパラメータを使用します。これは、モデル・ビュー列の名前およびタイプの数値および文字列スカラー・データ型のリストを指定するSELECT問合せを含む文字列です。

RALG_DETAILS_FORMATRALG_DETAILS_FUNCTIONの両方が指定されている場合、名前DM$VD <model_name>によるモデル・ビューが、Rモデルとともに現在のスキーマに作成されます。モデル・ビューの最初の列はPARTITION_NAMEです。パーティション化されていないモデルの場合NULL値となります。モデル・ビューの他の列は、RALG_DETATLS_FORMATによって定義されます。

例25-6 RALG_DETAILS_FORMATの例

この例は、生成されたモデル・ビューの列の名前およびタイプを指定する方法を示しています。モデル・ビューには、最初の列partition_nameの後にvarchar2列のattr_nameおよび数値列coef_valueが含まれます。
Begin
insert into model_setting_table values
(dbms_data_mining.ralg_details_format, 'select cast(''a'' as varchar2(20)) as attr_name, 0 as coef_value from dual');
End;
/

関連項目

25.3.5.4 RALG_SCORE_FUNCTION

mining_model_tableのRアルゴリズム・マイニング・モデル・スコアの既存の登録済Rスクリプトを指定するには、RALG_SCORE_FUNCTIONを使用します。

指定したRスクリプトによりR関数が定義されます。最初の入力引数は、モデル・オブジェクトを定義します。2番目の入力引数は、データのスコアリングに使用されるdata.frameを定義します。

例25-7 RALG_SCORE_FUNCTIONの例

この例は、関数がRモデルを取得し、data.frameでデータをスコアリングする方法を示します。引数オブジェクトは、R線形モデルです。引数newdataには、data.frame内のスコアリング・データが含まれます。
function(object, newdata) {res <- predict.lm(object, newdata = newdata, se.fit = TRUE); data.frame(fit=res$fit, se=res$se.fit, df=summary(object)$df[1L])}

この例では、次のようになります

  • objectは、LMモデルを示します

  • newdataは、スコアリングdata.frameを示します

指定したR関数の出力はdata.frameとなる必要があります。各行は、入力data.frameの対応するスコアリング・データの予測を表しています。data.frameの列は、次のようにマイニング機能固有です。

回帰: 予測対象のターゲット値の単一の数値列であり、モデル適合の標準誤差および自由度の2つのオプション列があります。オプション列は、問合せ関数PREDICTION_BOUNDSが動作するために必要です。

例25-8 回帰用のRALG_SCORE_FUNCTIONの例

この例は、model_setting_tableでのモデルのスコアリングに使用されるRスクリプトMY_LM_PREDICT_SCRIPTの名前の指定方法を示しています。

Begin
insert into model_setting_table values
(dbms_data_mining.ralg_score_function, 'MY_LM_PREDICT_SCRIPT');
End;
/
Rスクリプト・リポジトリでは、スクリプトMY_LM_PREDICT_SCRIPTは次のように登録されます。
function(object, newdata) {data.frame(pre = predict(object, newdata = newdata))}

分類: 各列は、1つのターゲット・クラスの予測確率を表します。列名は、ターゲット・クラス名です。

例25-9 分類用のRALG_SCORE_FUNCTIONの例

この例は、model_setting_tableでのロジット分類モデルのスコアリングに使用されるRスクリプトMY_LOGITGLM_PREDICT_SCRIPTの名前の指定方法を示しています。

Begin
insert into model_setting_table values
(dbms_data_mining.ralg_score_function, 'MY_LOGITGLM_PREDICT_SCRIPT');
End;
/
Rスクリプト・リポジトリでは、MY_LOGITGLM_PREDICT_SCRIPTは次のように登録されます。これは、"0"と "1"の2つのターゲット・クラスを持つロジット分類です。
'function(object, newdata) {
   pred <- predict(object, newdata = newdata, type="response");
   res <- data.frame(1-pred, pred);
   names(res) <- c("0", "1");
   res}'

クラスタリング: 各列は、1つのクラスタの予測確率を表します。列は、クラスタIDの順に並べられます。各クラスタにはクラスタIDが割り当てられ、これは1から始まる連続した値です。RモデルでCLUSTER_DISTANCEをサポートするには、Rスコア・ファンクションの出力は、予測確率の列の後に、クラスタIDの順で各クラスタへの距離の値を含む追加列を戻します。

例25-10 クラスタリング用のRALG_SCORE_FUNCTIONの例

この例は、model_setting_tableでのモデルのスコアリングに使用されるRスクリプトMY_CLUSTER_PREDICT_SCRIPTの名前の指定方法を示しています。

Begin
insert into model_setting_table values
(dbms_data_mining.ralg_score_function, 'MY_CLUSTER_PREDICT_SCRIPT');
End;
/
Rスクリプト・リポジトリでは、スクリプトMY_CLUSTER_PREDICT_SCRIPTは次のように登録されます。
'function(object, dat){
     mod <- object[[1L]]; ce <- object[[2L]]; sc <- object[[3L]];
     newdata = scale(dat, center = ce, scale = sc);
     centers <- mod$centers;
     ss <- sapply(as.data.frame(t(centers)),
     function(v) rowSums(scale(newdata, center=v, scale=FALSE)^2));
     if (!is.matrix(ss)) ss <- matrix(ss, ncol=length(ss));
     disp <- -1 / (2* mod$tot.withinss/length(mod$cluster));
     distr <- exp(disp*ss);
     prob <- distr / rowSums(distr);
     as.data.frame(cbind(prob, sqrt(ss)))}'
この関数は、Rモデルからクラスタの中央値をフェッチし、スコア・データから対応するクラスタの中央値への距離に基づいて、各クラスタに属する確率を計算します。

特徴抽出: 各列は、1つの特徴の係数値を表します。列は、特徴IDの順に並べられます。各特徴には特徴IDが割り当てられ、これは1から始まる連続した値です。

例25-11 特徴抽出用のRALG_SCORE_FUNCTIONの例

この例は、model_setting_tableでのモデルのスコアリングに使用されるRスクリプトMY_FEATURE_EXTRACTION_SCRIPTの名前の指定方法を示しています。

Begin
insert into model_setting_table values
(dbms_data_mining.ralg_score_function, 'MY_FEATURE_EXTRACTION_SCRIPT');
End;
/
Rスクリプト・リポジトリでは、スクリプトMY_FEATURE_EXTRACTION_SCRIPTは次のように登録されます。
 'function(object, dat) { as.data.frame(predict(object, dat)) }'

この関数は、Rモデルから特徴の中央値をフェッチし、スコア・データから対応する特徴の中央値への距離に基づいて、特徴の係数を計算します。

25.3.5.5 RALG_WEIGHT_FUNCTION

スコアリング内の各属性の重みまたは寄与率を計算する、既存の登録済Rスクリプトの名前を指定するには、RALG_WEIGHT_FUNCTIONを使用します。指定したRスクリプトは、問合せ関数PREDICTION_DETAILSで、属性の寄与率を評価するために使用されます。

指定したRスクリプトは、モデル・オブジェクトの最初の入力引数、およびスコアリング・データのdata.frameの2番目の入力引数を含むR関数を定義します。マイニング機能が分類、クラスタリングまたは特徴抽出の場合、ターゲット・クラス名、クラスタIDまたは特徴IDが3番目の入力引数によって渡され、その特定のクラス、クラスタまたは特徴の重みが計算されます。スクリプトにより、各属性の影響を与える重みが行内に含まれるdata.frameが戻されます。各行は、その入力スコアリングdata.frameに対応しています。

例25-12 RALG_WEIGHT_FUNCTIONの例

この例は、model_setting_tableでのRモデル属性の重みまたは寄与率を計算するRスクリプトMY_PREDICT_WEIGHT_SCRIPTの名前の指定方法を示しています。
Begin
insert into model_setting_table values
(dbms_data_mining.ralg_weight_function, 'MY_PREDICT_WEIGHT_SCRIPT');
End;
/
Rスクリプト・リポジトリでは、回帰用のスクリプトMY_PREDICT_WEIGHT_SCRIPTは次のように登録されます。
'function(mod, data) { coef(mod)[-1L]*data }'
Rスクリプト・リポジトリでは、ロジット分類用のスクリプトMY_PREDICT_WEIGHT_SCRIPTは次のように登録されます。
'function(mod, dat, clas) {
   v <- predict(mod, newdata=dat, type = "response");
   v0 <- data.frame(v, 1-v); names(v0) <- c("0", "1");
   res <- data.frame(lapply(seq_along(dat),
   function(x, dat) {
   if(is.numeric(dat[[x]])) dat[,x] <- as.numeric(0)
   else dat[,x] <- as.factor(NA);
   vv <- predict(mod, newdata = dat, type = "response");
   vv = data.frame(vv, 1-vv); names(vv) <- c("0", "1");
   v0[[clas]] / vv[[clas]]}, dat = dat));
   names(res) <- names(dat);
   res}'
25.3.5.6 登録済Rスクリプト

RALG_*_FUNCTIONは、Rスクリプト・リポジトリ内に存在するRスクリプトを指定する必要があります。Rスクリプトは、Oracle R Enterpriseを使用すると登録できます。

RALG_*_FUNCTIONには、次の機能があります。

  • RALG_BUILD_FUNCTION

  • RALG_DETAILS_FUNCTION

  • RALG_SCORE_FUNCTION

  • RALG_WEIGHT_FUNCTION

注意:

Rモデルが機能するためには、RスクリプトがRスクリプト・リポジトリに存在する必要があります。

Rスクリプトは、Oracle Enterprise R (ORE)を通じて登録できます。Rスクリプトを登録するには、RQADMINロールが必要です。Rモデルを作成したら、この指定したRスクリプトの名前がモデルの設定になります。Rモデルが機能し続けるためには、このRスクリプトがRスクリプト・リポジトリに存在する必要があります。

Rモデルを作成、スコアリングおよび表示するために使用されるRメモリーも、Oracle Enterprise Rで管理できます。

25.3.5.7 Rモデルのデモ・スクリプト

rdbms/demoにあるRモデル・デモ・スクリプトにアクセスできます

dmraidemo.sql  dmrglmdemo.sql dmrpcademo.sql
dmrardemo.sql  dmrkmdemo.sql  dmrrfdemo.sql
dmrdtdemo.sql  dmrnndemo.sql 

25.4 モデルの詳細ビュー

GET_*インタフェースはモデル・ビューに置き換えられるため、かわりにこのビューを利用することをお薦めします。

次に、新しいモデル・ビューを示します。

相関:

分類、回帰、異常検出:

クラスタリング:

特徴抽出:

特徴選択:

データの準備およびその他:

25.4.1 相関ルールのモデル・ディテール・ビュー

相関ルールのモデル・ディテール・ビューは、相関ルールのルール・ビューを説明しています。GET_ASSOCIATION_RULESファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

ルール・ビューDM$VRmodel_nameは、相関ルールに対して生成されたルールを説明しています。モデルの設定によって、ルールの列セットは異なります。次のビューは、トランザクショナルおよび2次元の入力に対する集計なしで異なるグローバル設定が適用されたときに表示されます。

ASSO_AGGREGATES設定のないトランザクショナル入力

ODMS_ITEM_ID_COLUMN_NAMEが設定され、ITEM_VALUE (ODMS_ITEM_VALUE_COLUMN_NAME)が設定されていない場合、トランザクショナル・ビューは次のようになります。
Name                                      Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 RULE_ID                                   NUMBER
 RULE_SUPPORT                              NUMBER
 RULE_CONFIDENCE                           NUMBER
 RULE_LIFT                                 NUMBER
 RULE_REVCONFIDENCE                        NUMBER
 ANTECEDENT_SUPPORT                        NUMBER
 NUMBER_OF_ITEMS                           NUMBER
 CONSEQUENT_SUPPORT                        NUMBER
 CONSEQUENT_NAME                           VARCHAR2(4000)
 ANTECEDENT                                SYS.XMLTYPE

表25-11 トランザクショナル入力のルール・ビュー列

列名 説明

PARTITION_NAME

詳細を取得するパーティション化されたモデルのパーティション

RULE_ID

ターゲットの名前または識別子

RULE_SUPPORT

ルールを満たすトランザクションの数。

RULE_CONFIDENCE

トランザクションがルールを満たす確度。

RULE_LIFT

ルールが満たされた場合に、ランダムな可能性を上回る予測の改善の程度。

RULE_REVCONFIDENCE

ルールが発生するトランザクションの数を後件が発生するトランザクションの数で割ったもの。

ANTECEDENT_SUPPORT

トランザクションの合計数に対する、前件を満たすトランザクションの数の割合。

NUMBER_OF_ITEMS

ルールの前件と後件で参照される属性の合計数。

CONSEQUENT_SUPPORT

トランザクションの合計数に対する、後件を満たすトランザクションの数の割合。

CONSEQUENT_NAME

後件の名前

CONSEQUENT_SUBNAME

2次元の入力の場合、CONSEQUENT_SUBNAMEが、入力データ表内のネストした列に使用されます。「例: マーケット・バスケット分析用のネストした列の作成」を参照してください。この例では、ネストした列があります。CONSEQUENT_SUBNAMEは、ネストした列のATTRIBUTE_NAME部分です。つまり、'O/S Documentation Set - English'およびCONSEQUENT_VALUEは、ネストした列の値部分であり、1です。

2次元入力では、ODMS_ITEM_ID_COLUMN_NAMEが設定されていない場合、各項目は、NAMESUBNAMEおよびVALUEの3つの部分で構成されます。

ビューでは、後件用に3列が使用されます。ルール・ビューには次の列があります。

Name                                      Type
 ----------------------- --------------------- 
 PARTITION_NAME                            VARCHAR2(128)
 RULE_ID                                   NUMBER
 RULE_SUPPORT                              NUMBER
 RULE_CONFIDENCE                           NUMBER
 RULE_LIFT                                 NUMBER
 RULE_REVCONFIDENCE                        NUMBER
 ANTECEDENT_SUPPORT                        NUMBER
 NUMBER_OF_ITEMS                           NUMBER
 CONSEQUENT_SUPPORT                        NUMBER
 CONSEQUENT_NAME                           VARCHAR2(4000)
 CONSEQUENT_SUBNAME                        VARCHAR2(4000)
 CONSEQUENT_VALUE                          VARCHAR2(4000)
 ANTECEDENT                                SYS.XMLTYPE

注意:

3つの部分のすべての型はVARCHAR2です。ASSO_AGGREGATESが設定されている場合、この列は適用されません。

CONSEQUENT_VALUE

ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が量的のTYPEで設定されている場合の後件の値。ビューには、CONSEQUENT_VALUE列があります。

次のビューでは、CONSEQUENT_VALUETYPENUMBERです。

Name                                      Type
 -------------------------- -----------------------
 PARTITION_NAME                            VARCHAR2(128)
 RULE_ID                                   NUMBER
 RULE_SUPPORT                              NUMBER
 RULE_CONFIDENCE                           NUMBER
 RULE_LIFT                                 NUMBER
 RULE_REVCONFIDENCE                        NUMBER
 ANTECEDENT_SUPPORT                        NUMBER
 NUMBER_OF_ITEMS                           NUMBER
 CONSEQUENT_SUPPORT                        NUMBER
 CONSEQUENT_NAME                           VARCHAR2(4000)
 CONSEQUENT_VALUE                          NUMBER
 ANTECEDENT                                SYS.XMLTYPE

ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が質的のTYPEで設定されている場合、ビューには、CONSEQUENT_VALUE列があります。

次のビューでは、CONSEQUENT_VALUETYPEVARCHARです。

Name                                      Type
 ------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 RULE_ID                                   NUMBER
 RULE_SUPPORT                              NUMBER
 RULE_CONFIDENCE                           NUMBER
 RULE_LIFT                                 NUMBER
 RULE_REVCONFIDENCE                        NUMBER
 ANTECEDENT_SUPPORT                        NUMBER
 NUMBER_OF_ITEMS                           NUMBER
 CONSEQUENT_SUPPORT                        NUMBER
 CONSEQUENT_NAME                           VARCHAR2(4000)
 CONSEQUENT_VALUE                          VARCHAR2(4000)
 ANTECEDENT                                SYS.XMLTYPE

ANTECEDENT

ルール内の独立の条件。この条件が存在する場合は、後件に依存条件も存在します。条件は、述語(DM_PREDICATE)と呼ばれる属性値の組み合わせです。述語は、属性ごとの条件を指定します。条件としては、指定の値に等しい(=)、等しくない(<>)、より大(>)、より小(<)、以上(>=)、または以下(<=)を指定できます。前件の属性条件ごとに、支持度と信頼度が述語に戻されます。支持度は、前件を満たすトランザクションの数です。信頼度は、トランザクションが前件を満たす確度です。

ANTECEDENTには、各前件項目に対してITEM_VALUE (数値型)部分も含まれます。

注意:

DM_PREDICATE属性があることは、トランザクションに項目が存在することを示しています。attribute_num_valueまたはattribute_str_valueの実際の値に意味はありません。たとえば、次の述語は、属性値がNULLでもトランザクションにMouse Padが存在していることを示しています。

DM_PREDICATE('PROD_NAME', 'Mouse Pad', '= ', NULL, NULL, NULL, NULL))

ASSO_AGGREGATES設定があるトランザクショナル入力

集計設定のないビューと類似しており、3つのトランザクショナル・ケースがあります。次に、ケースを示します。
  • ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が設定されていない場合のルール・ビュー。

  • ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が量的のTYPEで設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE列があります。

  • ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が質的のTYPEで設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE列があります。

ASSO_AGGREGATESを含むビューには、集計出力の列(集計当たり4列)があります。2次元入力では、集計設定は許可されません。

例25-13 例

次の例は、集計対象として設定されている利益と売上を示しています。

Name                                      Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 RULE_ID                                   NUMBER
 RULE_SUPPORT                              NUMBER
 RULE_CONFIDENCE                           NUMBER
 RULE_LIFT                                 NUMBER
 RULE_REVCONFIDENCE                        NUMBER
 ANTECEDENT_SUPPORT                        NUMBER
 NUMBER_OF_ITEMS                           NUMBER
 CONSEQUENT_SUPPORT                        NUMBER
 CONSEQUENT_NAME                           VARCHAR2(4000)
 ANTECEDENT                                SYS.XMLTYPE
 ANT_RULE_PROFIT                           BINARY_DOUBLE
 CON_RULE_PROFIT                           BINARY_DOUBLE
 ANT_PROFIT                                BINARY_DOUBLE
 CON_PROFIT                                BINARY_DOUBLE
 ANT_RULE_SALES                            BINARY_DOUBLE
 CON_RULE_SALES                            BINARY_DOUBLE
 ANT_SALES                                 BINARY_DOUBLE
 CON_SALES                                 BINARY_DOUBLE
ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が量的のTYPEで設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE列があります。
Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 PARTITION_NAME                                     VARCHAR2(128)
 RULE_ID                                            NUMBER
 RULE_SUPPORT                                       NUMBER
 RULE_CONFIDENCE                                    NUMBER
 RULE_LIFT                                          NUMBER
 RULE_REVCONFIDENCE                                 NUMBER
 ANTECEDENT_SUPPORT                                 NUMBER
 NUMBER_OF_ITEMS                                    NUMBER
 CONSEQUENT_SUPPORT                                 NUMBER
 CONSEQUENT_NAME                                    VARCHAR2(4000)
 CONSEQUENT_VALUE                                   NUMBER
 ANTECEDENT                                         SYS.XMLTYPE
 ANT_RULE_PROFIT                                    BINARY_DOUBLE
 CON_RULE_PROFIT                                    BINARY_DOUBLE
 ANT_PROFIT                                         BINARY_DOUBLE
 CON_PROFIT                                         BINARY_DOUBLE
 ANT_RULE_SALES                                     BINARY_DOUBLE
 CON_RULE_SALES                                     BINARY_DOUBLE
 ANT_SALES                                          BINARY_DOUBLE
 CON_SALES                                          BINARY_DOUBLE

ODMS_ITEM_ID_COLUMN_NAMEが設定されていて、Item_value (ODMS_ITEM_VALUE_COLUMN_NAME)が質的のTYPEで設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE列があります。

Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 PARTITION_NAME                                     VARCHAR2(128)
 RULE_ID                                            NUMBER
 RULE_SUPPORT                                       NUMBER
 RULE_CONFIDENCE                                    NUMBER
 RULE_LIFT                                          NUMBER
 RULE_REVCONFIDENCE                                 NUMBER
 ANTECEDENT_SUPPORT                                 NUMBER
 NUMBER_OF_ITEMS                                    NUMBER
 CONSEQUENT_SUPPORT                                 NUMBER
 CONSEQUENT_NAME                                    VARCHAR2(4000)
 CONSEQUENT_VALUE                                   VARCHAR2(4000)
 ANTECEDENT                                         SYS.XMLTYPE
 ANT_RULE_PROFIT                                    BINARY_DOUBLE
 CON_RULE_PROFIT                                    BINARY_DOUBLE
 ANT_PROFIT                                         BINARY_DOUBLE
 CON_PROFIT                                         BINARY_DOUBLE
 ANT_RULE_SALES                                     BINARY_DOUBLE
 CON_RULE_SALES                                     BINARY_DOUBLE
 ANT_SALES                                          BINARY_DOUBLE
 CON_SALES                                          BINARY_DOUBLE

相関ルールのグローバルな詳細

単一のグローバルな詳細は、相関モデルによって生成されます。次の表は、相関ルール・モデルに対して戻されるグローバルな詳細について説明しています。

表25-12 相関ルールのグローバルな詳細

名前 説明

ITEMSET_COUNT

生成された項目セットの数

MAX_SUPPORT

最大サポート

NUM_ROWS

ビルドで使用される合計行数

RULE_COUNT

生成されるモデル内の相関ルールの数

TRANSACTION_COUNT

入力データのトランザクションの数

25.4.2 高頻度項目セットのモデル・ディテール・ビュー

高頻度項目セットのモデル・ディテール・ビューは、高頻度項目セット・ビューを説明しています。GET_FREQUENT_ITEMSETSファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

高頻度項目セット・ビューDM$VImodel_nameには、次のスキーマがあります。

Name		          Type
 ------------- ------------------
 PARTITION_NAME   VARCHAR2 (128)
 ITEMSET_ID       NUMBER
 SUPPORT          NUMBER
 NUMBER_OF_ITEMS  NUMBER
 ITEMSET          SYS.XMLTYPE

表25-13 高頻度項目ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション

ITEMSET_ID

項目セット識別子

SUPPORT

項目セットのサポート

NUMBER_OF_ITEMS

項目セット内の項目の数

ITEMSET

高頻度項目セット

SYS.XMLTYPE列項目セットの構造は、ルール・ビューの対応する前件列と同じです。

25.4.3 トランザクショナル項目セットのモデル・ディテール・ビュー

トランザクショナル項目セットのモデル・ディテール・ビューは、トランザクショナル項目セット・ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。

集計のないトランザクショナル・データのよくあるケースとして、DM$VTmodel_nameビューは、トランザクショナル形式の項目セット情報を提供します。このビューは、XML列を含むビューと比較して、一部の問合せのパフォーマンスの向上に役立ちます。トランザクショナル項目セット・ビューには次のスキーマがあります。

Name		            Type
 ----------------- -----------------
 PARTITION_NAME      VARCHAR2(128)
 ITEMSET_ID          NUMBER
 ITEM_ID             NUMBER
 SUPPORT             NUMBER
 NUMBER_OF_ITEMS     NUMBER
 ITEM_NAME           VARCHAR2(4000)

表25-14 トランザクショナル項目セット・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション

ITEMSET_ID

項目セット識別子

ITEM_ID

項目識別子

SUPPORT

項目セットのサポート

NUMBER_OF_ITEMS

項目セット内の項目の数

ITEM_NAME

アイテムの名前

25.4.4 トランザクショナル・ルールのモデル・ディテール・ビュー

トランザクショナル・ルールのモデル・ディテール・ビューは、トランザクショナル・ルール・ビューおよびトランザクショナル項目セット・ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。

集計のないトランザクショナル・データには、トランザクショナル・ルール・ビューDM$VAmodel_nameもあります。このビューにより、XML列を含むビューと比較して、一部の問合せのパフォーマンスの向上を図れます。トランザクショナル・ルール・ビューには次のスキーマがあります。

Name                                      Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 RULE_ID                                   NUMBER
 ANTECEDENT_PREDICATE                      VARCHAR2(4000)
 CONSEQUENT_PREDICATE                      VARCHAR2(4000)
 RULE_SUPPORT                              NUMBER
 RULE_CONFIDENCE                           NUMBER
 RULE_LIFT                                 NUMBER
 RULE_REVCONFIDENCE                        NUMBER
 RULE_ITEMSET_ID                           NUMBER
 ANTECEDENT_SUPPORT                        NUMBER
 CONSEQUENT_SUPPORT                        NUMBER
 NUMBER_OF_ITEMS                           NUMBER

表25-15 トランザクショナル・ルール・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション

RULE_ID

ルール識別子

ANTECEDENT_PREDICATE

前件項目の名前。

CONSEQUENT_PREDICATE

後件項目の名前

RULE_SUPPORT

ルールのサポート

RULE_CONFIDENCE

前件が含まれる場合にトランザクションがルールを満たす確度。

RULE_LIFT

ルールが満たされた場合に、ランダムな可能性を上回る予測の改善の程度

RULE_REVCONFIDENCE

ルールが発生するトランザクションの数を後件が発生するトランザクションの数で割ったもの

RULE_ITEMSET_ID

項目セット識別子

ANTECEDENT_SUPPORT

トランザクションの合計数に対する、前件を満たすトランザクションの数の割合

CONSEQUENT_SUPPORT

トランザクションの合計数に対する、後件を満たすトランザクションの数の割合

NUMBER_OF_ITEMS

ルール内の項目の数

25.4.5 分類アルゴリズムのモデル・ディテール・ビュー

分類アルゴリズムのモデル・ディテール・ビューは、すべての分類アルゴリズムに適用されるターゲット・マップ・ビューおよびスコアリング・コスト・ビューを説明しています。GET_*ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

ターゲット・マップ・ビューDM$VTmodel_nameは、分類モデルに対するターゲット分布を説明しています。このビューには次のスキーマが含まれます。

Name                                      Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 TARGET_VALUE                              NUMBER/VARCHAR2 
 TARGET_COUNT                              NUMBER
 TARGET_WEIGHT                             NUMBER

表25-16 ターゲット・マップ・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

TARGET_VALUE

ターゲット値(量的または質的)

TARGET_COUNT

特定のTARGET_VALUEの行数

TARGET_WEIGHT

特定のTARGET_VALUEの重み

スコアリング・コスト・ビューDM$VCmodel_nameは、分類モデルに対するスコアリング・コスト・マトリックスを説明しています。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- --------------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ACTUAL_TARGET_VALUE                       NUMBER/VARCHAR2  
 PREDICTED_TARGET_VALUE                    NUMBER/VARCHAR2  
 COST                                      NUMBER

表25-17 スコアリング・コスト・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ACTUAL_TARGET_VALUE

有効なターゲット値

PREDICTED_TARGET_VALUE

予測対象ターゲット値

COST

実際のターゲット値と予測されたターゲット値のペアに対して関連付けられたコスト

25.4.6 ディシジョン・ツリーのモデル・ディテール・ビュー

ディシジョン・ツリーのモデル・ディテール・ビューは、分岐情報ビュー、ノード統計ビュー、ノード説明ビューおよびコスト・マトリックス・ビューを説明しています。GET_MODEL_DETAILS_XMLファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

分岐情報ビューDM$VPmodel_nameは、ディシジョン・ツリー内の各レベルのツリー階層および分岐情報を説明しています。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ---------------------------
 PARTITION_NAME                     VARCHAR2(128)
 PARENT                             NUMBER              
 SPLIT_TYPE                         VARCHAR2            
 NODE                               NUMBER              
 ATTRIBUTE_NAME                     VARCHAR2(128)       
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)      
 OPERATOR                           VARCHAR2            
 VALUE                              SYS.XMLTYPE 

表25-18 分岐情報ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

PARENT

親のノードID

SPLIT_TYPE

メイン分岐またはサロゲート分岐

NODE

ノードID

ATTRIBUTE_NAME

このノードを生成するために、親ノードで分岐基準として使用される属性。

ATTRIBUTE_SUBNAME

分岐属性のサブ名。この値は、ネストされていない列に対してはNULLです。

OPERATOR

分岐演算子

VALUE

分岐基準として使用される値。これは、<Element>タグを使用して記述されるXML要素です。

たとえば、<Element>Windy</Element><Element>Hot</Element>などとなります。

ノード統計ビューDM$VImodel_nameは、個々のツリー・ノードに関連付けられている統計を説明しています。統計には、ノード内のデータのターゲット・ヒストグラムが含まれます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 NODE                               NUMBER      
 NODE_SUPPORT                       NUMBER       
 PREDICTED_TARGET_VALUE             NUMBER/VARCHAR2
 TARGET_VALUE                       NUMBER/VARCHAR2 
 TARGET_SUPPORT                     NUMBER   

表25-19 ノード統計ビュー

パラメータ 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

NODE

ノードID

NODE_SUPPORT

ノードに属するトレーニング・セット内のレコード数

PREDICTED_TARGET_VALUE

予測対象ターゲット値

TARGET_VALUE

トレーニング・データ内に表示されるターゲット値

TARGET_SUPPORT

ノードに属し、TARGET_VALUE列で指定されている値を持つレコード数

より高いレベルのノードの説明が、DM$VOmodel_nameビューに表示されます。DM$VOmodel_nameには、次のスキーマがあります。

ame                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 NODE                               NUMBER                
 NODE_SUPPORT                       NUMBER                
 PREDICTED_TARGET_VALUE             NUMBER/VARCHAR2       
 PARENT                             NUMBER               
 ATTRIBUTE_NAME                     VARCHAR2(128)       
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)       
 OPERATOR                           VARCHAR2             
 VALUE                              SYS.XMLTYPE  

表25-20 ノードの説明ビュー

パラメータ 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

NODE

ノードID

NODE_SUPPORT

ノードに属するトレーニング・セット内のレコード数

PREDICTED_TARGET_VALUE

予測対象ターゲット値

PARENT

親のID

ATTRIBUTE_NAME

属性名を指定します

ATTRIBUTE_SUBNAME

属性サブ名を指定します

OPERATOR

属性述語演算子 - 次の値を使用する条件演算子。

IN=<>< ><=および>=

VALUE

説明の基準として使用される値。これは、<Element>タグを使用して記述されるXML要素です。

たとえば、<Element>Windy</Element><Element>Hot</Element>などとなります。

DM$VMmodel_nameビューは、ディシジョン・ツリーの作成によって使用されるコスト・マトリックスを説明しています。DM$VMmodel_nameビューには、次のスキーマがあります。

Name                                       Type
 ----------------------------------------- --------------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ACTUAL_TARGET_VALUE                       NUMBER/VARCHAR2 
 PREDICTED_TARGET_VALUE                    NUMBER/VARCHAR2 
 COST                                      NUMBER

表25-21 コスト・マトリックス・ビュー

パラメータ 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ACTUAL_TARGET_VALUE

有効なターゲット値

PREDICTED_TARGET_VALUE

予測対象ターゲット値

COST

実際のターゲット値と予測されたターゲット値のペアに対して関連付けられたコスト

次の表では、ディシジョン・ツリーのグローバル・ビューについて説明します。

表25-22 モデル・グローバル・ビューのディシジョン・ツリー統計情報

名前 説明

NUM_ROWS

ビルドで使用される合計行数

25.4.7 一般化線形モデルのモデル・ディテール・ビュー

一般化線形モデル(GLM)のモデル・ディテール・ビューは、線形およびロジスティック回帰のモデル・ディテール・ビューおよび行診断ビューを説明します。GET_MODEL_DETAILS_GLMファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

モデル・ディテール・ビューDM$VDmodel_nameは、線形回帰モデルとロジスティック回帰モデルの両方の最終モデル情報を説明しています。

線形回帰の場合、DM$VDmodel_nameには、次のスキーマがあります。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 FEATURE_EXPRESSION                 VARCHAR2(4000)
 COEFFICIENT                        BINARY_DOUBLE
 STD_ERROR                          BINARY_DOUBLE
 TEST_STATISTIC                     BINARY_DOUBLE
 P_VALUE                            BINARY_DOUBLE
 VIF                                BINARY_DOUBLE
 STD_COEFFICIENT                    BINARY_DOUBLE
 LOWER_COEFF_LIMIT                  BINARY_DOUBLE
 UPPER_COEFF_LIMIT                  BINARY_DOUBLE

ロジスティック回帰の場合、DM$VDmodel_nameには、次のスキーマがあります。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 TARGET_VALUE                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 FEATURE_EXPRESSION                 VARCHAR2(4000)
 COEFFICIENT                        BINARY_DOUBLE
 STD_ERROR                          BINARY_DOUBLE
 TEST_STATISTIC                     BINARY_DOUBLE
 P_VALUE                            BINARY_DOUBLE
 STD_COEFFICIENT                    BINARY_DOUBLE
 LOWER_COEFF_LIMIT                  BINARY_DOUBLE
 UPPER_COEFF_LIMIT                  BINARY_DOUBLE
 EXP_COEFFICIENT                    BINARY_DOUBLE
 EXP_LOWER_COEFF_LIMIT              BINARY_DOUBLE
 EXP_UPPER_COEFF_LIMIT              BINARY_DOUBLE

表25-23 線形およびロジスティック回帰モデルのモデル・ビュー

列名 説明

PARTITION_NAME

モデル内の特徴の名前

TARGET_VALUE

有効なターゲット値

ATTRIBUTE_NAME

サブ名がない場合は属性名、サブ名がある場合は属性名の最初の部分。ATTRIBUTE_NAMEは、ソース表またはビューの列の名前です。列が、ネストされていない数値列の場合、ATTRIBUTE_NAMEはマイニング属性の名前です。切片の場合、ATTRIBUTE_NAMEはNULLです。切片は、SVMモデルのバイアスに相当する用語です。

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ネストした列が数値の場合、マイニング属性は、ATTRIBUTE_NAME - ATTRIBUTE_SUBNAMEの組合せによって識別されます。列がネストしていない場合、ATTRIBUTE_SUBNAMEはNULLです。属性が切片の場合、ATTRIBUTE_NAMEATTRIBUTE_SUBNAMEの両方がNULLです。

ATTRIBUTE_VALUE

質的列またはネストした質的列とみなすことができる一意の値。質的列では、マイニング属性は、一意のATTRIBUTE_NAME.ATTRIBUTE_VALUEのペアによって識別されます。ネストした質的列では、マイニング属性は、ATTRIBUTE_NAME.ATTRIBUTE_SUBNAME.ATTRIBUTE_VALUEの組合せによって識別されます。量的属性の場合、ATTRIBUTE_VALUEはNULLです。

FEATURE_EXPRESSION

特徴選択が有効な場合、アルゴリズムによって作成される特徴名です。特徴選択が有効でない場合、この特徴名は、単に完全修飾された属性名になります(属性がネストした列内にあるときはattribute_name.attribute_subnameになる)。質的属性では、次のような形式の特徴名が作成されます。

fully-qualified_attribute_name.attribute_value

特徴生成が有効な場合、モデル内の用語は、単一のマイニング属性または最大3つのマイニング属性の積となります。コンポーネント・マイニング属性は、単一の用語内で繰り返すことができます。特徴生成が有効ではない場合、または特徴生成が有効であるが、複数のコンポーネントの用語がCREATEモデル・プロセスによって検出されない場合、FEATURE_EXPRESSIONはNULLになります。

注意:

Oracle Database 12cリリース2では、アルゴリズムによって、量的コンポーネントから平均が減算されません。

COEFFICIENT

推定係数。

STD_ERROR

係数推定値の標準誤差。

TEST_STATISTIC

線形回帰の場合、係数推定値のt値。

ロジスティック回帰の場合、係数推定値のWaldカイ二乗値。

P_VALUE

モデル内の用語が統計的に重要ではない(NULL)仮定の下のTEST_STATISTICの確率。低い確率は用語が重要であることを示し、高い確率は用語を破棄した方がよいことを示します。モデルの特定の属性の重要度を分析するのに使用されます。

VIF

分散拡大要因。切片の場合、この値はゼロです。ロジスティック回帰の場合、VIFはNULLです。

STD_COEFFICIENT

係数の標準化推定値。

LOWER_COEFF_LIMIT

係数の信頼限界値の下限。

UPPER_COEFF_LIMIT

係数の信頼限界値の上限。

EXP_COEFFICIENT

ロジスティック回帰の場合は指数係数線形

回帰の場合、EXP_COEFFICIENTはNULLです。

EXP_LOWER_COEFF_LIMIT

ロジスティック回帰の場合、係数の信頼限界値の下限に対する指数係数。線形回帰の場合、EXP_LOWER_COEFF_LIMITはNULLです。

EXP_UPPER_COEFF_LIMIT

ロジスティック回帰の場合、係数の信頼限界値の上限に対する指数係数。線形回帰の場合、EXP_UPPER_COEFF_LIMITはNULLです。

行診断ビューDM$VAmodel_nameは、線形回帰モデルとロジスティック回帰モデルの両方の行レベル情報を説明しています。線形回帰の場合、DM$VAmodel_nameには、次のスキーマがあります。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CASE_ID                            NUMBER/VARHCAR2
 TARGET_VALUE                       BINARY_DOUBLE
 PREDICTED_TARGET_VALUE             BINARY_DOUBLE
 Hat                                BINARY_DOUBLE
 RESIDUAL                           BINARY_DOUBLE
 STD_ERR_RESIDUAL                   BINARY_DOUBLE
 STUDENTIZED_RESIDUAL               BINARY_DOUBLE
 PRED_RES                           BINARY_DOUBLE
 COOKS_D                            BINARY_DOUBLE

表25-24 線形回帰の行診断ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

CASE_ID

ケースIDの名前

TARGET_VALUE

入力行から取得される実際のターゲット値

PREDICTED_TARGET_VALUE

行のモデル予測ターゲット値

HAT

ハット・マトリックスによって特定の入力行で識別されるn*n (n=行数)の対角線上の要素。入力データのモデル予測は、ハット・マトリックスと入力ターゲット値のベクターの積です。対角線上の要素(ハット値)は、i番目の適合した値上のi番目の行の影響を表します。大きいハット値は、i番目の行が影響力の大きいポイントであり、潜在的な外れ値であることを示すインジケータです。

RESIDUAL

特定の入力行の予測と実際のターゲット値間の差異。

STD_ERR_RESIDUAL

標準残余誤差(ステューデント化残差とも呼ばれる)は、入力行の残差を比較可能にするために、残差を再スケーリングしてすべての入力行にわたる定数分散を得ます。このプロセスは、残差を行の重さの平方根で乗算し、平均平方誤差の積およびハット値から1減算した値で除算します。

STUDENTIZED_RESIDUAL

スチューデント化削除残差は、現在の行の影響のために、標準残余誤差を調整します。

PRED_RES

予測残差は、削除残差の重み付きの2乗であり、行の重みを残差の2乗で乗算し、ハット値から1を減算した値で除算して算出されます。

COOKS_D

クックの距離は、すべての推定回帰係数上のi番目のケースの複合的影響のメジャーです。

ロジスティック回帰の場合、DM$VAmodel_nameには、次のスキーマがあります。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CASE_ID                            NUMBER/VARHCAR2
 TARGET_VALUE                       NUMBER/VARCHAR2
 TARGET_VALUE_PROB                  BINARY_DOUBLE
 Hat                                BINARY_DOUBLE
 WORKING_RESIDUAL                   BINARY_DOUBLE
 PEARSON_RESIDUAL                   BINARY_DOUBLE
 DEVIANCE_RESIDUAL                  BINARY_DOUBLE
 C                                  BINARY_DOUBLE
 CBAR                        	    BINARY_DOUBLE
 DIFDEV                             BINARY_DOUBLE
 DIFCHISQ                           BINARY_DOUBLE

表25-25 ロジスティック回帰の行診断ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

CASE_ID

ケースIDの名前

TARGET_VALUE

入力行から取得される実際のターゲット値

TARGET_VALUE_PROB

予測ターゲット値の確率のモデル推定値。

Hat

線形回帰のハット値の概念は、線形回帰ハッチ値をロジスティック回帰の分散関数で乗算することでロジスティック回帰に拡張され、予測確率は、予測確率から1を減算した値で乗算されます。

WORKING_RESIDUAL

作業残差は、作業応答の残差です。作業応答は、線形化スケール上の応答です。ロジスティック回帰の場合、i番目の行の残差がi番目の行の予測の分散で除算される形式となります。予測の分散は、予測確率を予測確率から1を減算した値で乗算し算出されます。

WORKING_RESIDUALは、作業応答と収束時の線形予測子間の差異です。

PEARSON_RESIDUAL

ピアソン残差は、重みを考慮した、作業残差の再スケーリングされたバージョンです。ロジスティック回帰の場合、ピアソン残差は、残差を、重み平方根として計算される係数で乗算し、i番目の行の予測確率の分散で除算し算出されます。

RESIDUALは、行の実際のターゲット値の予測確率から1を減算した値です。

DEVIANCE_RESIDUAL

DEVIANCE_RESIDUALは、i番目の観測のモデル逸脱度への寄与率です。ロジスティック回帰では、非参照クラスの場合、2の平方根×log(1 + e^eta) - etaの形式となり、参照クラスの場合2の平方根×log (1 + eta)となり、この場合のetaは線形予測(モデルが線形回帰とする場合の予測)です。

C

削除されたもの(i番目のポイント)を含む、すべてのポイントに対するi番目の観察の削除による、適合ロジット内の変更全体を測定します。これは、ピアソン残差の2乗をハット値で乗算し、ハット値から1減算した値の2乗で除算して算出されます。

個々の観察による影響のスカラー測定を提供する、信頼区間の置換診断。

CBAR

CおよびCBARは、ロジスティック回帰のクックの距離の拡張です。CBARは、削除されたもの(i番目のポイント)を除く、すべてのポイントに対するi番目の観察の削除による、適合ロジット内の変更全体を測定します。これは、ピアソン残差の2乗をハット値で乗算し、(ハット値から1減算した値)で除算して算出されます。

個々の観察の削除による影響を測定する、信頼区間の置換診断。

DIFDEV

観測値が入力から削除されたときに発生する逸脱度の変化を測定する統計。逸脱度残差の2乗にCBARを加算して算出されます。

DIFCHISQ

観測値が入力から削除されたときに発生するピアソンのカイ二乗の変化を測定する統計。CBARをハット値で除算して算出されます。

GLMのグローバルな詳細: 線形回帰

次の表は、線形回帰モデルによって戻されるグローバルな詳細について説明しています。

表25-26 線形回帰のグローバルな詳細

名前 説明

ADJUSTED_R_SQUARE

調整済R2乗

AIC

赤池情報量基準

COEFF_VAR

変動の係数

CONVERGED

モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。
  • YES

  • NO

CORRECTED_TOTAL_DF

修正された総自由度。

CORRECTED_TOT_SS

修正された総平方和。

DEPENDENT_MEAN

依存平均

ERROR_DF

誤差の自由度。

ERROR_MEAN_SQUARE

誤差平均平方

ERROR_SUM_SQUARES

誤差の平方和。

F_VALUE

モデルのF値の統計。

GMSEP

予測の推定平均平方誤差。多変量正規性を想定しています。

HOCKING_SP

HockingのSp統計

ITERATIONS

SGD反復数を追跡します。ソルバーがSGDの場合にのみ適用できます。

J_P

JP統計(最終予測誤差)。

MODEL_DF

モデルの自由度。

MODEL_F_P_VALUE

モデルのF値の確率。

MODEL_MEAN_SQUARE

モデルの平均平方誤差

MODEL_SUM_SQUARES

モデルの平方和誤差

NUM_PARAMS

パラメータ数(切片を含む係数の数)。

NUM_ROWS

行数

R_SQ

R2乗

RANK_DEFICIENCY

多重共線性のためにモデルから除外された予測子の数

ROOT_MEAN_SQ

2乗平均平方根誤差。

SBIC

Schwarzのベイズ情報量基準。

GLMのグローバルな詳細: ロジスティック回帰

次の表は、ロジスティック回帰モデルによって戻されるグローバルな詳細を示しています。

表25-27 ロジスティック回帰のグローバルな詳細

名前 説明

AIC_INTERCEPT

切片のみのベースライン・モデルの適合度に関する赤池の基準

AIC_MODEL

切片および共変量(予測子)モデルの適合度に関する赤池の基準。

CONVERGED

モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。
  • YES

  • NO

DEPENDENT_MEAN

依存平均

ITERATIONS

SGD反復数(IRLS反復数)を追跡します。ソルバーがSGDの場合にのみ適用できます。

LR_DF

尤度比の自由度。

LR_CHI_SQ

尤度比のカイ二乗値。

LR_CHI_SQ_P_VALUE

尤度比のカイ二乗確率値。

NEG2_LL_INTERCEPT

切片のみのベースライン・モデルの-2対数尤度

NEG2_LL_MODEL

モデルの-2対数尤度。

NUM_PARAMS

パラメータ数(切片を含む係数の数)。

NUM_ROWS

行数

PCT_CORRECT

正確な予測の割合。

PCT_INCORRECT

不正確に予測された行の割合。

PCT_TIED

両方のターゲット・クラスの推定確率が等しくなる割合

PSEUDO_R_SQ_CS

擬似R二乗(CoxおよびSnell)

PSEUDO_R_SQ_N

擬似R2乗(Nagelkerke)

RANK_DEFICIENCY

多重共線性のためにモデルから除外された予測子の数

SC_INTERCEPT

切片のみのベースライン・モデルの適合度に関するシュワルツの基準

SC_MODEL

切片および共変量(予測子)モデルの適合度に関するSchwarzの基準。

注意:

  • 「リッジ回帰」が有効な場合、戻されるグローバルな詳細がより少なくなります。リッジの詳細は、『Oracle Data Mining概要』を参照してください。

  • パーティション化されたモデルで値がNULLの場合、例外がスローされます。値がNULLでない場合、目的のパーティション名が含まれる必要があります。

25.4.8 Naive Bayesのモデル・ディテール・ビュー

Naive Bayesのモデル・ディテール・ビューは、事前のビューおよび結果ビューを説明しています。GET_MODEL_DETAILS_NBファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

事前ビューDM$VPmodel_nameは、Naïve Bayesに対するターゲットの事前の状態を説明しています。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 TARGET_NAME                               VARCHAR2(128)
 TARGET_VALUE                              NUMBER/VARCHAR2
 PRIOR_PROBABILITY                         BINARY_DOUBLE
 COUNT                                     NUMBER

表25-28 Naive Bayesの事前ビュー

列名 説明

PARTITION_NAME

モデル内の特徴の名前

TARGET_NAME

ターゲット列の名前

TARGET_VALUE

ターゲット値(量的または質的)

PRIOR_PROBABILITY

特定のTARGET_VALUEの事前確率

COUNT

特定のTARGET_VALUEの行数

Naïve Bayes結果ビューDM$VVmodel_viewは、Naïve Bayesモデルの条件付き確率を説明しています。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 TARGET_NAME                               VARCHAR2(128)
 TARGET_VALUE                              NUMBER/VARCHAR2
 ATTRIBUTE_NAME                            VARCHAR2(128)
 ATTRIBUTE_SUBNAME                         VARCHAR2(4000)
 ATTRIBUTE_VALUE                           VARCHAR2(4000)
 CONDITIONAL_PROBABILITY                   BINARY_DOUBLE
 COUNT                                     NUMBER

表25-29 Naive Bayesの結果ビュー

列名 説明

PARTITION_NAME

モデル内の特徴の名前

TARGET_NAME

ターゲット列の名前

TARGET_VALUE

ターゲット値(量的または質的)

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

ATTRIBUTE_NAMEのマイニング属性値またはネストした列ATTRIBUTE_SUBNAME (存在する場合)。

CONDITIONAL_PROBABILITY

特定のターゲットのマイニング属性の条件付き確率

COUNT

特定のマイニング属性および特定のターゲットの行数

次の表は、Naive Bayesのグローバル・ビューについて説明しています。

表25-30 モデル・グローバル・ビューのNaive Bayes統計情報

名前 説明

NUM_ROWS

ビルドで使用される合計行数

25.4.9 サポート・ベクター・マシンのモデル・ディテール・ビュー

サポート・ベクター・マシンのモデル・ディテール・ビューは、線形係数ビューを説明しています。GET_MODEL_DETAILS_SVMファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

線形係数ビューDM$VLmodel_nameは、線形SVMアルゴリズムの係数を説明しています。ビューのtarget_valueフィールドは分類にのみ存在し、ターゲットの型を持ちます。回帰モデルにはtarget_valueフィールドがありません。

reversed_coefficientフィールドは、自動データ準備変換を元に戻した後の係数の値が表示されます。データ準備が無効な場合、coefficientreversed_coefficientの値は同じになります。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- --------------------------------
 PARTITION_NAME                            VARCHAR2(128)
 TARGET_VALUE                              NUMBER/VARCHAR2
 ATTRIBUTE_NAME                            VARCHAR2(128)
 ATTRIBUTE_SUBNAME                         VARCHAR2(4000)
 ATTRIBUTE_VALUE                           VARCHAR2(4000)
 COEFFICIENT                               BINARY_DOUBLE
 REVERSED_COEFFICIENT                      BINARY_DOUBLE

表25-31 サポート・ベクター・マシンの線形係数ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

TARGET_VALUE

ターゲット値(量的または質的)

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

質的属性の値

COEFFICIENT

予測係数値

REVERSED_COEFFICIENT

元のスケールで変換された係数

次の表は、サポート・ベクター統計グローバル・ビューを説明しています。

表25-32モデル・グローバル・ビューのサポート・ベクター統計情報

名前 説明

CONVERGED

モデル作成プロセスが指定された許容値に収束したかどうかを示します。
  • YES

  • NO

ITERATIONS

作成中の反復回数

NUM_ROWS

作成で使用される行の数

REMOVED_ROWS_ZERO_NORM

標準が0のために削除された行の数。このことは、1つのクラスの線形モデルにのみ適用されます。

25.4.10 クラスタリング・アルゴリズムのモデル・ディテール・ビュー

Oracle Data Miningは、期待値最大化、k-Meansおよび直交パーティショニング・クラスタリング(O-Cluster)などのクラスタリング・アルゴリズムをサポートしています。

すべてのクラスタリング・アルゴリズムで、次のビューが共有されます。

  • クラスタ説明DM$VDmodel_name

  • 属性統計DM$VAmodel_name

  • ヒストグラム統計DM$VHmodel_name

  • ルール統計DM$VRmodel_name

クラスタ説明ビューDM$VDmodel_nameは、クラスタリング・モデルのクラスタ・レベル情報を説明しています。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 CLUSTER_NAME                       NUMBER/VARCHAR2  
 RECORD_COUNT                       NUMBER
 PARENT                             NUMBER           
 TREE_LEVEL                         NUMBER           
 LEFT_CHILD_ID                      NUMBER           
 RIGHT_CHILD_ID                     NUMBER 

表25-33 クラスタリング・アルゴリズムのクラスタ説明ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

CLUSTER_ID

モデル内のクラスタのID

CLUSTER_NAME

クラスタのラベルを指定します

RECORD_COUNT

レコードの数を指定します。

PARENT

親のID

TREE_LEVEL

ルートからの分岐の数を指定します。

LEFT_CHILD_ID

分岐の左側の子クラスタのID

RIGHT_CHILD_ID

分岐の右側の子クラスタのID

属性ビューDM$VAmodel_nameは、クラスタリング・モデルの属性レベル情報を説明しています。特定のクラスタの平均、分散およびモードの値は、このビューから取得できます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 CLUSTER_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 MEAN                               BINARY_DOUBLE
 VARIANCE                           BINARY_DOUBLE
 MODE_VALUE                         VARCHAR2(4000)

表25-34 クラスタリング・アルゴリズムの属性ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション

CLUSTER_ID

モデル内のクラスタのID

CLUSTER_NAME

クラスタのラベルを指定します

ATTRIBUTE_NAME

属性名を指定します

ATTRIBUTE_SUBNAME

属性サブ名を指定します

MEAN

このフィールドにより、数値属性の平均値が戻されます

VARIANCE

数値属性の分散

MODE_VALUE

モードとは、質的属性の最頻値です。

ヒストグラム・ビューDM$VHmodel_nameは、クラスタリング・モデルのヒストグラム・レベル情報を説明しています。ビン情報およびビン数は、このビューから取得できます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 CLUSTER_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 BIN_ID                             NUMBER
 LOWER_BIN_BOUNDARY                 BINARY_DOUBLE                
 UPPER_BIN_BOUNDARY                 BINARY_DOUBLE         
 ATTRIBUTE_VALUE                    VARCHAR2(4000)       
 COUNT                              NUMBER  

表25-35 クラスタリング・アルゴリズムのヒストグラム・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション

CLUSTER_ID

モデル内のクラスタのID

CLUSTER_NAME

クラスタのラベルを指定します

ATTRIBUTE_NAME

属性名を指定します

ATTRIBUTE_SUBNAME

属性サブ名を指定します

BIN_ID

ビンID

LOWER_BIN_BOUNDARY

量的ビンの下限

UPPER_BIN_BOUNDARY

量的ビンの上限

ATTRIBUTE_VALUE

質的属性値

COUNT

ヒストグラム数

ルール・ビューDM$VRmodel_nameは、クラスタリング・モデルのルール・レベル情報を説明しています。情報は、属性の述語レベルで提供されます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER              
 CLUSTER_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 OPERATOR                           VARCHAR2(2)         
 NUMERIC_VALUE                      NUMBER              
 ATTRIBUTE_VALUE                    VARCHAR2(4000)      
 SUPPORT                            NUMBER              
 CONFIDENCE                         BINARY_DOUBLE       
 RULE_SUPPORT                       NUMBER              
 RULE_CONFIDENCE                    BINARY_DOUBLE 

表25-36 クラスタリング・アルゴリズムのルール・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション

CLUSTER_ID

モデル内のクラスタのID

CLUSTER_NAME

クラスタのラベルを指定します

ATTRIBUTE_NAME

属性名を指定します

ATTRIBUTE_SUBNAME

属性サブ名を指定します

OPERATOR

属性述語演算子 - 次の値を使用する条件付き演算子: IN=<><><=および>=

NUMERIC_VALUE

量的ビンの下限

ATTRIBUTE_VALUE

質的属性値

SUPPORT

属性述語のサポート

CONFIDENCE

属性述語の信頼度

RULE_SUPPORT

ルール・レベルのサポート

RULE_CONFIDENCE

ルール・レベルの信頼度

25.4.11 期待値最大化のモデル・ディテール・ビュー

期待値最大化(EM)のモデル・ディテール・ビューは、クラスタリング・ビューのそれに対するEMのビューにおける差異を説明しています。GET_MODEL_DETAILS_EMファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

次のビューは、クラスタリング・ビューに対する期待値最大化のビューの相違点を示しています。様々なクラスタリング・ビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。

コンポーネント・ビューDM$VOmodel_nameは、EMコンポーネントを説明しています。コンポーネント・ビューには、事前確率およびマップ先のクラスタに関する情報が含まれています。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 COMPONENT_ID                       NUMBER
 CLUSTER_ID                         NUMBER
 PRIOR_PROBABILITY                  BINARY_DOUBLE

表25-37 コンポーネント・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

COMPONENT_ID

コンポーネントの一意の識別子

CLUSTER_ID

モデル内のクラスタのID

PRIOR_PROBABILITY

コンポーネント事前確率

平均および分散コンポーネント・ビューDM$VMmodel_nameは、ガウス分布モデル別の属性の平均および分散パラメータに関する情報を提供します。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 COMPONENT_ID                       NUMBER
 ATTRIBUTE_NAME                     VARCHAR2(4000)
 MEAN                               BINARY_DOUBLE
 VARIANCE                           BINARY_DOUBLE

頻度コンポーネント・ビューDM$VFmodel_nameは、EMモデルによって使用される複数値ベルヌーイ分布のパラメータに関する情報を提供します。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 COMPONENT_ID                       NUMBER
 ATTRIBUTE_NAME                     VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 FREQUENCY                          BINARY_DOUBLE

表25-38 頻度コンポーネント・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

COMPONENT_ID

コンポーネントの一意の識別子

ATTRIBUTE_NAME

列名

ATTRIBUTE_VALUE

質的属性値

FREQUENCY

ATTRIBUTE_NAMEおよびATTRIBUTE_VALUEによって指定されている属性/値の組合せの複数値ベルヌーイ分散の頻度。

2次元列の場合、EMは属性評価の属性ランク付けと類似したものを提供します。このランク付けは、列のペアに対して計算されたカルバック・ライブラー・ダイバージェンスにわたる、ランクで重み付けされた平均に基づきます。この監視なし属性評価は、DM$VImodel_nameビューに表示され、次のスキーマを含みます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ATTRIBUTE_NAME                            VARCHAR2(128)
 ATTRIBUTE_IMPORTANCE_VALUE                BINARY_DOUBLE
 ATTRIBUTE_RANK                            NUMBER

表25-39 期待値最大化の2次元属性ランク付け

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ATTRIBUTE_NAME

列名

ATTRIBUTE_IMPORTANCE_VALUE

評価の値

ATTRIBUTE_RANK

評価の値に基づく属性ランク

pairwiseカルバック・ライブラー・ダイバージェンスは、DM$VBmodel_nameビューにレポートされます。このメトリックは、観察対象の2つの属性の結合分布が、独立性の仮定の下に、予想される分布とどの程度異なっているかを評価します。つまり、値が大きいほど、2つの属性がより依存していることになります。独立性の値は、各ペアワイズ計算に使用されるグリッドのサイズに基づいてスケーリングされます。このため、[0; 1]範囲内の全ての値が比較可能になります。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ATTRIBUTE_NAME_1                          VARCHAR2(128)
 ATTRIBUTE_NAME_2                          VARCHAR2(128)
 DEPENDENCY                                BINARY_DOUBLE

表25-40 期待値最大化のカルバック・ライブラー・ダイバージェンス

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ATTRIBUTE_NAME_1

属性1の名前

ATTRIBUTE_NAME_2

属性2の名前

DEPENDENCY

スケーリングされたペアワイズ・カルバック・ライブラー・ダイバージェンス

予測表DM$VPmodel_nameは、ネストした列をより下の次元空間にマップするために、ランダム予測によって使用される係数を示します。このビューには、作成データ内にネストしたデータまたはテキスト・データが存在する場合のみ行が含まれます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 FEATURE_NAME                       VARCHAR2(4000)
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 COEFFICIENT                        NUMBER

表25-41 期待値の最大化の予測表

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

FEATURE_NAME

特徴の名前

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

質的属性値

COEFFICIENT

予測係数。データ表現はまばらなため、ゼロ以外の係数のみが戻されます。

期待値の最大化のグローバルな詳細

次の表は、期待値の最大化のグローバルな詳細について説明しています。

表25-42 期待値の最大化のグローバルな詳細

名前 説明

CONVERGED

モデル作成プロセスが指定された許容値に収束したかどうかを示します。可能な値は次のとおりです:

  • YES

  • NO

LOGLIKELIHOOD

作成データの対数尤度

NUM_COMPONENTS

モデルで生成されるコンポーネントの数

NUM_CLUSTERS

モデルで生成されるクラスタの数

NUM_ROWS

作成で使用される行の数

RANDOM_SEED

モデル作成で使用される乱数シード値

REMOVED_COMPONENTS

モデルから除外する空のコンポーネントの数

25.4.12 k-Meansのモデル・ディテール・ビュー

k-Means (KM)のモデル・ディテール・ビューは、クラスタの説明ビューおよびスコアリング・ビューを説明しています。GET_MODEL_DETAILS_KMファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

この項では、クラスタリング・ビューに対するk-Meansのビュー内の相違点を説明しています。様々なビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。k-Meansの場合、クラスタの説明ビューDM$VDmodel_nameには、追加の列があります。

Name                                Type
 ---------------------------------- ----------------------------
 DISPERSION                         BINARY_DOUBLE

表25-43 k-Meansのクラスタの説明

列名 説明

DISPERSION

標準の統計モデルと比較して、一連の確認された出現が分散しているかどうかを定量化するために使用されるメジャー。

スコアリング・ビューDM$VCmodel_nameは、各リーフ・クラスタの重心を説明しています。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 CLUSTER_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 VALUE                              BINARY_DOUBLE

表25-44 k-Meansのスコアリング・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

CLUSTER_ID

モデル内のクラスタのID

CLUSTER_NAME

クラスタのラベルを指定します

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

質的属性値

VALUE

重心の値を指定します

次の表は、k–Meansのグローバル・ビューについて説明しています。

表25-45 モデル・グローバル・ビューのk–Means統計情報

名前 説明

CONVERGED

モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。

  • YES

  • NO

NUM_ROWS

作成で使用される行の数

REMOVED_ROWS_ZERO_NORM

標準が0のために削除された行の数。このことは、コサイン距離を使用するモデルにのみ適用されます。

25.4.13 O-Clusterのモデル・ディテール・ビュー

O-Clusterのモデル・ディテール・ビューは、統計ビューを説明しています。GET_MODEL_DETAILS_OCファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

次は、クラスタリング・ビューに対するO-Clusterのビューの相違点を示しています。様々なクラスタリング・ビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。OCアルゴリズムでは、期待値最大化(EM)およびk-Means (KM)と同じ記述統計ビューが使用されます。次に統計ビューを示します。

  • クラスタ説明DM$VDmodel_name

  • 属性統計DM$VAmodel_name

  • ルール統計DM$VRmodel_name

  • ヒストグラム統計DM$VHmodel_name

クラスタ説明ビューDM$VDmodel_nameは、O-Clusterコンポーネントを説明しています。クラスタ説明ビューには、分岐述語を示す追加フィールドがあります。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 OPERATOR                           VARCHAR2(2)        
 VALUE                              SYS.XMLTYPE

表25-46 説明ビュー

列名 説明

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

OPERATOR

分岐演算子

VALUE

分岐値のリスト

SYS.XMLTYPEの構造は、次のとおりです。
<Element>splitval1</Element>

OCアルゴリズムでは、ヒストグラム・ビューDM$VHmodel_nameが、EMおよびk-Means (KM)とは異なるスキーマとともに使用されます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITON_NAME                      VARCHAR2(128)
 CLUSTER_ID                         NUMBER
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 BIN_ID                             NUMBER
 LABEL                              VARCHAR2(4000)   
 COUNT                              NUMBER          

表25-47 ヒストグラム・コンポーネント・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

CLUSTER_ID

コンポーネントの一意の識別子

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

BIN_ID

一意の識別子

LABEL

ビン・ラベル

COUNT

ビン・ヒストグラム数

次の表は、O-Clusterのグローバル・ビューについて説明しています。

表25-48 モデル・グローバル・ビューのO-Cluster統計情報

名前 説明

NUM_ROWS

ビルドで使用される合計行数

25.4.14 明示的セマンティック分析のモデル・ディテール・ビュー

明示的セマンティック分析(ESA)のモデル・ディテール・ビューは、属性統計ビューおよび特徴ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。

ESAアルゴリズムには、次の記述統計ビューがあります。

  • 属性統計DM$VAmodel_name

  • 特徴DM$VFmodel_name

ビューDM$VAmodel_nameには、次のスキーマがあります。

PARTITION_NAME                      VARCHAR2(128)
 FEATURE_ID                         NUMBER/VARCHAR2 
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 COEFFICIENT                        BINARY_DOUBLE

表25-49 明示的セマンティック分析の属性ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

FEATURE_ID

トレーニング・データに表示される特徴の一意の識別子

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

質的属性値

COEFFICIENT

特徴に関する属性の重みのメジャー

ビューDM$VFmodel_nameには、1つのビュー内のすべての特徴に対して一意の行があります。この特徴は、モデルが事前作成されていて、ソース・トレーニング・データが使用不可の場合に役立ちます。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 FEATURE_ID                         NUMBER/VARCHAR2

表25-50 明示的セマンティック分析の特徴ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

FEATURE_ID

トレーニング・データに表示される特徴の一意の識別子

次の表は、明示的セマンティック分析のグローバル・ビューについて説明しています。

表25-51 モデル・グローバル・ビューの明示的セマンティック分析統計情報

名前 説明

NUM_ROWS

入力行の合計数

REMOVED_ROWS_BY_FILTERS

フィルタによって削除された行の数

25.4.15 Non-Negative Matrix Factorizationのモデル・ディテール・ビュー

Non-Negative Matrix Factorization (NMF)のモデル・ディテール・ビューは、エンコーディングHマトリックス・ビューおよびH逆マトリックス・ビューを説明しています。GET_MODEL_DETAILS_NMFファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

NMFアルゴリズムには、2つのマトリックス・コンテンツ・ビューがあります。

  • エンコーディング(H)マトリックスDM$VEmodel_name

  • H逆マトリックスDM$VImodel_name

ビューDM$VEmodel_nameは、NMFモデルのエンコーディング(H)マトリックスを説明しています。FEATURE_NAME列の型は、NUMBERまたはVARCHAR2のいずれかです。このビューには次のスキーマ定義が含まれます。

 Name		     Type
 ------------------- --------------------------
 PARTITION_NAME       VARCHAR2(128)
 FEATURE_ID           NUMBER
 FEATURE_NAME         NUMBER/VARCHAR2
 ATTRIBUTE_NAME       VARCHAR2(128)
 ATTRIBUTE_SUBNAME    VARCHAR2(4000)
 ATTRIBUTE_VALUE      VARCHAR2(4000)
 COEFFICIENT          BINARY_DOUBLE

表25-52 Non-Negative Matrix FactorizationのエンコーディングHマトリックス・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

FEATURE_ID

モデル内の特徴のID

FEATURE_NAME

モデル内の特徴の名前

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

属性の値を指定します

COEFFICIENT

特徴への寄与率を表す属性エンコーディング

ビューDM$VImodel_viewは、NMFモデルの逆Hマトリックスを説明しています。FEATURE_NAME列の型は、NUMBERまたはVARCHAR2のいずれかです。このビューには次のスキーマが含まれます。

 Name	           Type
 ----------------- ------------------------
 PARTITION_NAME     VARCHAR2(128)
 FEATURE_ID         NUMBER
 FEATURE_NAME       NUMBER/VARCHAR2
 ATTRIBUTE_NAME     VARCHAR2(128)
 ATTRIBUTE_SUBNAME  VARCHAR2(4000)
 ATTRIBUTE_VALUE    VARCHAR2(4000)
 COEFFICIENT        BINARY_DOUBLE

表25-53 Non-Negative Matrix Factorizationの逆Hマトリックス・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

FEATURE_ID

モデル内の特徴のID

FEATURE_NAME

モデル内の特徴の名前

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

属性の値を指定します

COEFFICIENT

特徴への寄与率を表す属性エンコーディング

次の表は、Non-Negative Matrix Factorizationのグローバル統計について説明しています。

表25-54 モデル・グローバル・ビューのNon-Negative Matrix Factorization統計情報

名前 説明

CONV_ERROR

収束エラー

CONVERGED

モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。
  • YES

  • NO

ITERATIONS

作成中の反復回数

NUM_ROWS

ビルド入力データセットで使用される行の数

SAMPLE_SIZE

ビルドで使用される行の数

25.4.16 特異値分解のモデル・ディテール・ビュー

特異値分解(SVD)のモデル・ディテール・ビューは、Sマトリックス・ビュー、右特異ベクター・ビューおよび左特異ベクター・ビューを説明しています。GET_MODEL_DETAILS_SVDファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

DM$VEmodel_nameは、SVDモデル内の各特異値には、関連付けられている主成分分析(PCA)モデル内に対応する主成分があるという事実を利用して、両方のモデル・クラスの共通情報セットを関連付けます。SVDモデルの場合、Sマトリックスのコンテンツを説明します。PCAスコアリングが作成設定として選択されている場合、対応する主成分の分散値および累積分散率も表示されます。このビューには次のスキーマが含まれます。

 Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 FEATURE_ID                         NUMBER
 FEATURE_NAME                       NUMBER/VARCHAR2
 VALUE                              BINARY_DOUBLE
 VARIANCE                           BINARY_DOUBLE  
 PCT_CUM_VARIANCE                   BINARY_DOUBLE 

表25-55 Sマトリックス・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

FEATURE_ID

モデル内の特徴のID

FEATURE_NAME

モデル内の特徴の名前

VALUE

マトリックスの入力値

VARIANCE

コンポーネントに記述された分散値。この列は、dbms_data_mining.svds_scoring_modedbms_data_mining.svds_scoring_pcaに設定されているSVDにのみ存在します

この列は、手動で、またはdbms_data_mining.prep_autodbms_data_mining.prep_auto_onへの設定により、作成データが中央にある場合のみNull以外になります。

PCT_CUM_VARIANCE

コンポーネントに記述された分散の累積率。コンポーネントは、記述した分散値に従って降順でランク付けされます。

この列は、dbms_data_mining.svds_scoring_modedbms_data_mining.svds_scoring_pcaに設定されているSVDにのみ存在します

この列は、手動で、またはdbms_data_mining.prep_autodbms_data_mining.prep_auto_onへの設定により、作成データが中央にある場合のみNull以外になります。

SVD DM$VVmodel_viewは、SVDモデルの右特異ベクターを説明しています。PCAモデルの場合、主成分(固有ベクター)を説明しています。このビューには次のスキーマが含まれます。

Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 FEATURE_ID                         NUMBER
 FEATURE_NAME                       NUMBER/VARCHAR2
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 ATTRIBUTE_VALUE                    VARCHAR2(4000)
 VALUE                              BINARY_DOUBLE

表25-56 特異値分解の右特異ベクター

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

FEATURE_ID

モデル内の特徴のID

FEATURE_NAME

モデル内の特徴の名前

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_VALUE

質的属性値。量的属性の場合、ATTRIBUTE_VALUEはNULLです。

VALUE

マトリックスの入力値

ビューDM$VUmodel_nameは、SVDモデルの左特異ベクターを説明しています。PCAモデルの場合、主成分内のデータの予測を説明しています。このビューは、設定dbms_data_mining.svds_u_matrix_outputdbms_data_mining.svds_u_matrix_enableに設定されていない場合、存在しません。このビューには次のスキーマが含まれます。
Name                                Type
 ---------------------------------- ----------------------------
 PARTITION_NAME                     VARCHAR2(128)
 CASE_ID                            NUMBER/VARHCAR2
 FEATURE_ID                         NUMBER
 FEATURE_NAME                       NUMBER/VARCHAR2
 VALUE                              BINARY_DOUBLE

表25-57 特異値分解の左特異ベクターまたは主成分内の予測データ

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

CASE_ID

U マトリックス予測によって記述される作成データ内にある、一意の行識別子。

FEATURE_ID

モデル内の特徴のID

FEATURE_NAME

モデル内の特徴の名前

VALUE

マトリックスの入力値

特異値分解のグローバルな詳細

次の表は、特異値分解のグローバルな詳細について説明しています。

表25-58 特異値分解のグローバルな詳細

名前 説明

NUM_COMPONENTS

モデルで生成される特徴(コンポーネント)の数

NUM_ROWS

ビルドで使用される合計行数

SUGGESTED_CUTOFF

モデルの分散値のほとんどが、計算された上位何個の特徴で取得されているかを示す推奨カットオフ。このカットオフ値よりも少ない数の特徴を使用することが、次元削減における有効な方策です。

25.4.17 最小記述長のモデル・ディテール・ビュー

最小記述長(属性評価の計算用)のモデル・ディテール・ビューは、属性評価ビューを説明しています。GET_MODEL_DETAILS_AIファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

属性評価ビューDM$VAmodel_nameは、属性評価および属性評価ランクについて説明しています。このビューには次のスキーマが含まれます。

Name                                       Type
 ----------------------------------------- ----------------------------
 PARTITION_NAME                            VARCHAR2(128)
 ATTRIBUTE_NAME                            VARCHAR2(128)
 ATTRIBUTE_SUBNAME                         VARCHAR2(4000)
 ATTRIBUTE_IMPORTANCE_VALUE                BINARY_DOUBLE
 ATTRIBUTE_RANK                            NUMBER

表25-59 最小記述長の属性評価ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

ATTRIBUTE_IMPORTANCE_VALUE

評価の値

ATTRIBUTE_RANK

評価に基づくランク

次の表では、最小記述長のグローバル・ビューについて説明します。

表25-60 モデル・グローバル・ビューの最小記述長統計情報

名前 説明

NUM_ROWS

ビルドで使用される合計行数

25.4.18 ビニングのモデル・ディテール・ビュー

ビニング・ビューDM$VBは、自動データ準備で使用されるビン境界を説明しています。

このビューには次のスキーマが含まれます。

Name                                Type
 --------------------       --------------------
 PARTITION_NAME                     VARCHAR2(128)
 ATTRIBUTE_NAME                     VARCHAR2(128)   
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)  
 BIN_ID                             NUMBER           
 LOWER_BIN_BOUNDARY                 BINARY_DOUBLE          
 UPPER_BIN_BOUNDARY                 BINARY_DOUBLE   
 ATTRIBUTE_VALUE                    VARCHAR2(4000) 

表25-61 ビニングのモデル・ディテール・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ATTRIBUTE_NAME

属性名を指定します

ATTRIBUTE_SUBNAME

属性サブ名を指定します

BIN_ID

ビンID (またはビン識別子)

LOWER_BIN_BOUNDARY

量的ビンの下限

UPPER_BIN_BOUNDARY

量的ビンの上限

ATTRIBUTE_VALUE

質的値

25.4.19 グローバル情報のモデル・ディテール・ビュー

グローバル情報のモデル・ディテール・ビューは、グローバル統計ビュー、アラート・ビューおよび計算済設定ビューを説明しています。GET_MODEL_DETAILS_GLOBALファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。

グローバル統計ビューDM$VGmodel_nameは、モデル作成に関連するグローバル統計について説明しています。例として、作成に使用される行数、コンバージェンス・ステータスおよびモデルの質メトリックがあります。このビューには次のスキーマが含まれます。

Name                                Type
 -------------------         --------------------
 PARTITION_NAME                     VARCHAR2(128)
 NAME                               VARCHAR2(30)     
 NUMERIC_VALUE                      NUMBER           
 STRING_VALUE                       VARCHAR2(4000) 

表25-62 グローバル統計ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

NAME

統計の名前

NUMERIC_VALUE

統計の量的値

STRING_VALUE

統計の質的値

アラート・ビューDM$VWmodel_nameは、モデルの作成中に発行されたアラートをリストします。このビューには次のスキーマが含まれます。

Name                                Type
 -------------------       ----------------------
 PARTITION_NAME                     VARCHAR2(128)
 ERROR_NUMBER                       BINARY_DOUBLE
 ERROR_TEXT                         VARCHAR2(4000)  

表25-63 アラート・ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

ERROR_NUMBER

エラー番号(イベントがエラーのとき有効)

ERROR_TEXT

エラー・メッセージ

計算済設定ビューDM$VSmodel_nameは、アルゴリズムの計算済設定を示します。このビューには次のスキーマが含まれます。

Name                                Type
 -----------------          --------------------
 PARTITION_NAME                     VARCHAR2(128)
 SETTING_NAME                       VARCHAR2(30)
 SETTING_VALUE                      VARCHAR2(4000)

表25-64 計算済設定ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション名

SETTING_NAME

設定の名前

SETTING_VALUE

設定の値

25.4.20 正規化および欠損値の処理のモデル・ディテール・ビュー

正規化および欠損値の処理ビューDM$VNは、自動データ準備(ADP)で使用される正規化パラメータ、およびNULL値が発生したときの欠損値の置換を説明しています。欠損値の置換は、2次元の列にのみ適用され、ネストされた列には適用されません。

このビューには次のスキーマが含まれます。

Name                                Type
 ----------------------       -----------------------
 PARTITION_NAME                     VARCHAR2(128)
 ATTRIBUTE_NAME                     VARCHAR2(128)
 ATTRIBUTE_SUBNAME                  VARCHAR2(4000)
 NUMERIC_MISSING_VALUE              BINARY_DOUBLE  
 CATEGORICAL_MISSING_VALUE          VARCHAR2(4000)  
 NORMALIZATION_SHIFT                BINARY_DOUBLE   
 NORMALIZATION_SCALE                BINARY_DOUBLE 

表25-65 正規化および欠損値の処理ビュー

列名 説明

PARTITION_NAME

パーティション化されたモデルのパーティション

ATTRIBUTE_NAME

列名

ATTRIBUTE_SUBNAME

ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。

NUMERIC_MISSING_VALUE

量的欠損値の置換

CATEGORICAL_MISSING_VALUE

質的欠損値の置換

NORMALIZATION_SHIFT

正規化シフト値

NORMALIZATION_SCALE

正規化スケール値