25 モデルの作成
データ・マイニング・モデルを作成し、モデルの詳細を問い合せる方法について説明します。
25.1 モデルを作成する前の作業
モデルを作成する前に必要とされる準備手順について説明します。
モデルは、データ・マイニングを実行するデータベース・スキーマ・オブジェクトです。DBMS_DATA_MINING
PL/SQLパッケージは、マイニング・モデル(モデルの詳細)の作成、構成、評価および問合せを行うAPIです。
モデルを作成する前に、そのモデルで実行する処理を決定する必要があります。トレーニング・データを特定し、変換が必要かどうかを判断する必要があります。モデルの設定を指定して、モデルの動作に影響を与えることができます。次の表は、準備の手順をまとめたものです。
表25-1 マイニング・モデルを作成する準備
準備手順 | 説明 |
---|---|
「マイニング機能の選択」を参照 |
|
「アルゴリズムの選択」を参照 |
|
「データの準備」を参照 |
|
「データの変換」を参照 |
|
「モデルの設定の指定」を参照 |
25.2 CREATE_MODELプロシージャ
DBMS_DATA_MINING
パッケージのCREATE_MODEL
プロシージャは、指定されたデータを使用して、指定された名前およびマイニング機能を持つマイニング・モデルを作成します。モデルは、構成設定とユーザー指定の変換を使用して作成できます。
PROCEDURE CREATE_MODEL( model_name IN VARCHAR2, mining_function IN VARCHAR2, data_table_name IN VARCHAR2, case_id_column_name IN VARCHAR2, target_column_name IN VARCHAR2 DEFAULT NULL, settings_table_name IN VARCHAR2 DEFAULT NULL, data_schema_name IN VARCHAR2 DEFAULT NULL, settings_schema_name IN VARCHAR2 DEFAULT NULL, xform_list IN TRANSFORM_LIST DEFAULT NULL);
25.2.1 マイニング機能の選択
CREATE_MODEL
へのマイニング機能の提供について説明します。
マイニング機能は、CREATE_MODEL
プロシージャに必須の引数です。データ・マイニング機能によって、モデル化や解決の対象となり得る問題のクラスが特定されます。
データ・マイニング機能は、監視あり学習または監視なし学習のいずれかを実装しています。監視あり学習では、独立属性のセットを使用して従属属性の値またはターゲットを予測します。監視なし学習では従属属性と独立属性は区別されません。監視あり機能は予測的です。監視なし機能は記述的です。
注意:
データ・マイニングの用語では、機能(function)とは、特定のデータ・マイニング・アプローチを使用して解決される問題の一般的な種類です。SQL言語の用語では、関数(function)は値を戻す演算子です。
Oracle Data Miningのドキュメントでは、機能(function)またはマイニング機能(mining function)という用語は、データ・マイニング機能を表し、SQL関数(SQL function)またはSQLデータ・マイニング関数(SQL Data Mining function)という用語は、スコアリング(データ・マイニング・モデルの適用)用のSQL関数を表します。
CREATE_MODEL
のmining_function
パラメータに指定できる値を次の表に示します。
表25-2 マイニング・モデルの機能
関連項目
25.2.2 アルゴリズムの選択
モデルのアルゴリズム設定の指定について説明します。
ALGO_NAME
設定では、モデルのアルゴリズムを指定できます。マイニング機能に対してデフォルトのアルゴリズムを使用する場合、または使用できるアルゴリズムが1つしかない場合は、ALGO_NAME
設定を指定する必要はありません。モデルの設定を指定する手順については、「モデルの設定の指定」を参照してください。
表25-3 データ・マイニングのアルゴリズム
ALGO_NAMEの値 | アルゴリズム | デフォルトかどうか | マイニング・モデルの機能 |
---|---|---|---|
|
— |
||
|
— |
||
|
— |
||
|
期待値最大化 |
||
|
— |
特徴抽出 |
|
ALGO_EXTENSIBLE_LANG |
拡張可能アルゴリズムで使用される言語 |
— |
すべてのマイニング機能がサポートされています |
|
— |
||
|
k-Means |
デフォルト |
|
|
デフォルト |
||
|
Non-Negative Matrix Factorization |
デフォルト |
|
|
— |
クラスタリング |
|
|
特異値分解(主成分分析にも使用可能) |
— |
特徴抽出 |
|
デフォルト |
25.2.3 変換の指定
25.2.3.1 変換リストの作成
変換リストを作成する方法は次のとおりです。
-
DBMS_DATA_MINING_TRANSFORM
のSTACK
インタフェース。STACK
インタフェースは、属性または属性のグループに適用可能な事前定義された変換のセットを提供します。たとえば、すべての質的属性に対して監視ありビニングを指定することができます。 -
DBMS_DATA_MINING_TRANSFORM
のSET_TRANSFORM
プロシージャ。SET_TRANSFORM
プロシージャは、指定されたSQL式を指定された属性に適用します。たとえば、次の文では、country_id
の変換指示を、my_xforms
という変換リストに追加します。変換指示は、アルゴリズムの処理が開始される前にcountry_id
を10で割ります。逆変換はcountry_id
に10を掛けます。dbms_data_mining_transform.SET_TRANSFORM (my_xforms, 'country_id', NULL, 'country_id/10', 'country_id*10');
逆変換はモデルの詳細で適用されます。
country_id
が監視ありモデルのターゲットである場合、逆変換はスコアリングされるターゲットにも適用されます。
25.2.3.2 変換リストおよび自動データ準備
変換リストと自動データ準備(ADP)間の相互作用について理解します。
CREATE_MODEL
に対する変換リスト引数は、自動データ準備(ADP)を制御するPREP_AUTO
設定と次のように相互作用します。
-
ADPが有効で、変換リストを指定した場合、ユーザー指定の変換は自動変換とともに適用されてモデルに組み込まれます。指定した変換は、自動変換の前に実行されます。
-
ADPが無効で、変換リストを指定した場合、ユーザー指定の変換が適用されてモデルに組み込まれますが、システム生成の変換は実行されません。
-
ADPが有効で、変換リストを指定しなかった場合、システム生成の変換が適用されてモデルに組み込まれます。
-
ADPが無効で、変換リストも指定しなかった場合、変換はモデルに組み込まれません。モデルの作成、テストおよびスコアリングに使用するデータセットは別個に準備する必要があります。
25.2.4 パーティション化されたモデルについて
Oracle Data Miningは、永続的なOracle Data Miningのパーティション化されたモデルの作成をサポートしています。パーティション化されたモデルでは、複数のモデルが単一のモデル・エンティティ内のパーティションとして編成され表されるため、ユーザーは独立したデータのスライスに合せてモデルを簡単に作成し管理できます。
永続的とは、パーティション化されたモデルがディスク上の表現を持つことを意味します。この製品は、パーティション化されたモデルの編成を管理し、パーティション化モデルのスコアリング・プロセスを簡素化します。スコアリング時、USING
句の一部としてパーティション列を含める必要があります。
ALL_MINING_MODEL_PARTITIONS
ビューに表示されます。
関連項目:
-
『Oracle Data Miningユーザーズ・ガイド』
25.2.4.1 パーティション化されたモデルの作成プロセス
Oracle Data Miningでパーティション化されたモデルを作成するには、パーティション化キーが必要です。パーティション・キーは、設定表の作成設定を通じて設定します。
パーティション化キーとは、入力データ・セットからの1つ以上列(最大16)で構成されるカンマ区切りリストです。パーティション化キーは、パーティション化キーの離散値に基づいて、入力データを水平方向にスライスします。つまり、パーティション化は、連続した値に対する範囲のパーティション化とは対照的に、リスト値として実行されます。パーティション化キーは、NUMBER
およびVARCHAR2
のデータ型の列のみをサポートしています。
作成プロセス中、入力データ・セットは、指定されたキーの個別値に基づいてパーティション化されます。各データ・スライス(一意のキー値)が、その独自のモデル・パーティションとなります。結果として作成されるモデル・パーティションは分かれておらず、スタンドアロン・モデルとして表示されません。パーティション化されたモデルのパーティションの最大数のデフォルト値は、1000
パーティションです。異なるパーティション値を設定することもできます。入力データ・セットのパーティション数が、定義された最大数を超えている場合、Oracle Data Miningによって例外がスローされます。
パーティション化されたモデルでは、すべてのパーティションに共通の特徴、およびパーティション固有の特徴が編成されます。共通の特徴は、次のメタデータで構成されます。
-
モデル名
-
マイニング機能
-
マイニング・アルゴリズム
-
すべてのパーティションによって参照される全マイニング・モデル属性のスーパー・セット(シグネチャ)
-
ユーザー定義列変換の共通セット
-
グローバルと解釈されるユーザー指定またはデフォルトの作成設定。たとえば、自動データ準備(ADP)設定など
25.2.4.2 パーティション化されたモデル内のDDL
25.2.4.2.1 モデルの削除またはパーティションの削除
Oracle Data Miningは、特定のパーティション名の単一のモデル・パーティションの削除をサポートしています。
1つのパーティションしか残っていない場合、そのパーティションを明示的に削除することはできません。かわりに、そのパーティションを削除する前に別のパーティションを追加するか、モデル自体の削除を選択できます。パーティション化されたモデルを削除する場合、すべてのパーティションは、単一のアトミック操作で削除されます。パフォーマンスの観点から、DROP_PARTITION
オプションは効率的に動作するため、REPLACE
オプションを使用するのではなく、DROP_PARTITION
、ADD_PARTITION
の順に実行することをお薦めします。
25.2.4.2.2 パーティションの追加
Oracle Data Miningは、単一のパーティションまたは複数のパーティションの既存のパーティション化されたモデルへの追加をサポートしています。
追加は、入力データ・セットおよび既存のパーティション化されたモデルの名前に基づいて発生します。操作は、入力データ・セットおよび既存のパーティション化されたモデルをパラメータとして使用します。パーティション・キーは、入力データ・セットから抽出され、モデル・パーティションは入力データ・セットに対して作成されます。このパーティションは、パーティション化されたモデルとして追加されます。新規パーティションのパーティション・キーがモデル内の既存パーティションと競合する場合、次の3つの手法から選択して競合を解決できます。
-
ERROR
: パーティションを追加することなくADD操作を終了します。 -
REPLACE
: 競合するキーが検出された既存のパーティションを置き換えます。 -
IGNORE
: 競合するキーがある行を排除します。
入力データ・セットに複数のキーが含まれている場合、複数のパーティションが作成されます。モデル内のパーティションの合計数が、モデルの作成時に指定したユーザー定義最大数を超えると、エラーが発生します。パーティション数のデフォルトしきい値は1000
です。
25.2.4.3 パーティション化されたモデルのスコアリング
パーティション化されたモデルのスコアリングについて説明します。
パーティション化されたモデルのスコアリングは、パーティション化されていないモデルのそれと同じです。データ・マイニング機能の構文は同じですが、オプションのヒントを提供するように拡張されています。オプションのヒントは、パーティション化されたモデルのスコアリングを含む問合せのパフォーマンスに影響を及ぼす可能性があります。
パーティション化されたモデルのスコアリングでは、パーティショニング・キーの作成中に使用されるシグネチャ列が、スコアリング・データセットに存在している必要があります。この列は、一意のパーティション・キーを形成するために組合されます。この一意のキーは、特定の基底となるモデル・パーティションにマップされ、識別されたモデル・パーティションがその行のスコアリングに使用されます。
スコアリングに必要なパーティション化オブジェクトが、問合せの実行時にオンデマンドでロードされ、システム・グローバル領域(SGA)メモリーに応じて有効期限が切れます。
25.3 モデルの設定の指定
データ・マイニング・モデルの作成時の構成方法について理解します。
データ・マイニング・モデルは、作成時に多数の構成設定を使用して構成できます。設定を指定するには、次の表に示す列を持つ設定表を作成し、その表をCREATE_MODEL
に渡します。
表25-4 設定表に必要な列
列名 | データ型 |
---|---|
|
|
|
|
例25-1では、サポート・ベクター・マシン(SVM)分類モデルの設定表が作成されます。SVMはデフォルトの分類機能ではないため、ALGO_NAME
設定を使用してこのアルゴリズムを指定します。SVMS_KERNEL_FUNCTION
をSVMS_LINEAR
に設定することにより、モデルは線形カーネルを使用して作成されます。カーネル関数を指定しない場合、アルゴリズムがデータの属性の数に基づいてカーネルを選択します。
通常はモデルに適用される設定と、アルゴリズムに固有の設定があります。モデルの設定は表25-5および表25-6を参照してください。
表25-5 一般的なモデルの設定
設定 | 説明 |
---|---|
マイニング機能の設定 |
『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のマイニング機能の設定に関する説明を参照 |
アルゴリズムの名前 |
『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズム名に関する説明を参照 |
グローバルなモデルの特性 |
『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のグローバルな設定に関する説明を参照 |
自動データ準備 |
『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』の自動データ準備に関する説明を参照 |
表25-6 アルゴリズム固有のモデルの設定
アルゴリズム | 説明 |
---|---|
ディシジョン・ツリー |
『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: ディシジョン・ツリーに関する説明を参照 |
期待値最大化 |
『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: 期待値最大化に関する説明を参照 |
明示的セマンティック分析 |
『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズム設定: 明示的セマンティック分析に関する説明を参照 |
一般化線形モデル |
『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: 一般化線形モデルに関する説明を参照 |
k-Means |
『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: k-Meansに関する説明を参照 |
Naive Bayes |
『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: Naive Bayesに関する説明を参照 |
Non-Negative Matrix Factorization |
『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: Non-Negative Matrix Factorizationに関する説明を参照 |
O-Cluster |
『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: O-Clusterに関する説明を参照 |
特異値分解 |
『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: 特異値分解に関する説明を参照 |
サポート・ベクター・マシン |
『Oracle Database PL/SQLパッケージおよびタイプ・リファレンス』のアルゴリズムの設定: サポート・ベクター・マシンに関する説明を参照 |
例25-1 SVM分類モデルの設定表の作成
CREATE TABLE svmc_sh_sample_settings ( setting_name VARCHAR2(30), setting_value VARCHAR2(4000)); BEGIN INSERT INTO svmc_sh_sample_settings (setting_name, setting_value) VALUES (dbms_data_mining.algo_name, dbms_data_mining.algo_support_vector_machines); INSERT INTO svmc_sh_sample_settings (setting_name, setting_value) VALUES (dbms_data_mining.svms_kernel_function, dbms_data_mining.svms_linear); COMMIT; END; /
25.3.1 コストの指定
ディシジョン・ツリー・モデルを作成するためのコスト・マトリックスを指定します。
CLAS_COST_TABLE_NAME
設定は、ディシジョン・ツリー・モデルの作成に使用するコスト・マトリックス表の名前を指定します。コスト・マトリックスは、分類モデルにバイアスをかけて、コストのかかる分類ミスを最小化します。コスト・マトリックス表には、次の表に示す列が必要です。
表25-7 コスト・マトリックス表に必要な列
列名 | データ型 |
---|---|
|
有効なターゲット・データ型 |
|
有効なターゲット・データ型 |
|
|
ディシジョン・ツリーは、作成時にコスト・マトリックスを指定できる唯一のアルゴリズムです。ただし、スコアリングの際には、どの分類モデルにもコスト・マトリックスを作成して関連付けることができます。
スコアリングにコストを使用する場合は、表25-7に示す列を持つ表を作成し、DBMS_DATA_MINING.ADD_COST_MATRIX
プロシージャを使用してコスト・マトリックス表をモデルに追加します。PREDICTION
関数を呼び出すときに、コスト・マトリックスをインラインで指定することもできます。表23-1で、有効なターゲット・データ型の詳細を示しています。
関連項目
25.3.4 データ・ディクショナリにおけるモデルの設定
データ・ディクショナリ・ビューのALL/USER/DBA_MINING_MODEL_SETTINGS
について説明します。
マイニング・モデルの設定に関する情報は、データ・ディクショナリ・ビューALL/USER/DBA_MINING_MODEL_SETTINGS
から取得できます。ALL
接頭辞を使用した場合、このビューは、現在のユーザーがアクセスできるモデルの設定に関する情報を戻します。USER
接頭辞を使用した場合は、ユーザー・スキーマ内のモデルの設定に関する情報を戻します。DBA
接頭辞を使用できるのはDBAのみです。
ALL_MINING_MODEL_SETTINGS
の列は次のとおりです。各列の説明は、次の表を参照してください
SQL> describe all_mining_model_settings Name Null? Type ----------------------------------------- -------- ---------------------------- OWNER NOT NULL VARCHAR2(30) MODEL_NAME NOT NULL VARCHAR2(30) SETTING_NAME NOT NULL VARCHAR2(30) SETTING_VALUE VARCHAR2(4000) SETTING_TYPE VARCHAR2(7)
表25-10 ALL_MINING_MODEL_SETTINGS
列 | 説明 |
---|---|
|
マイニング・モデルの所有者。 |
|
マイニング・モデルの名前。 |
|
設定の名前。 |
|
設定の値。 |
|
|
次の問合せは、サポート・ベクター・マシン(SVM)の分類モデルSVMC_SH_CLAS_SAMPLE
の設定をリストします。ALGO_NAME
、CLAS_WEIGHTS_TABLE_NAME
およびSVMS_KERNEL_FUNCTION
の設定はユーザーが指定しています。これらの設定は、モデルの設定表で指定されています。
例25-2 ALL_MINING_MODEL_SETTINGS
SQL> COLUMN setting_value FORMAT A35 SQL> SELECT setting_name, setting_value, setting_type FROM all_mining_model_settings WHERE model_name in 'SVMC_SH_CLAS_SAMPLE'; SETTING_NAME SETTING_VALUE SETTING ------------------------------ ----------------------------------- ------- SVMS_ACTIVE_LEARNING SVMS_AL_ENABLE DEFAULT PREP_AUTO OFF DEFAULT SVMS_COMPLEXITY_FACTOR 0.244212 DEFAULT SVMS_KERNEL_FUNCTION SVMS_LINEAR INPUT CLAS_WEIGHTS_TABLE_NAME svmc_sh_sample_class_wt INPUT SVMS_CONV_TOLERANCE .001 DEFAULT ALGO_NAME ALGO_SUPPORT_VECTOR_MACHINES INPUT
25.3.5 Rモデルのマイニング・モデル設定の指定
Rモデルのマイニング・モデル設定によって、モデルの特性が決定されます。mining_model_table
でマイニング・モデル設定を指定できます。
ODMS_PARTITION_COLUMNS
、ODMS_SAMPLING
など、アルゴリズムを必要としない一般的な設定を組み合せることで、マイニング・モデル設定を使用してRモデルを作成できます。次の設定は、Rマイニング・モデルに対して排他的であり、Rマイニング・モデルの指定を可能にします。
関連項目
25.3.5.1 ALGO_EXTENSIBLE_LANG
拡張可能アルゴリズムによりOracle Data Miningフレームワークを指定するには、ALGO_EXTENSIBLE_LANG
設定を使用します。
現在、R
のみがALGO_EXTENSIBLE_LANG
の有効値です。ALGO_EXTENSIBLE_LANG
の値がRに設定されている場合、マイニング・モデルは、R言語を使用して作成されます。model_setting_table
の次の設定を使用して、Rモデルの作成、スコアおよび表示を指定できます。
関連項目
25.3.5.2 RALG_BUILD_FUNCTION
Rアルゴリズムのマイニング・モデル作成に対する、既存の登録済Rスクリプトの名前を指定するには、RALG_BUILD_FUNCTION
を使用します。
model_setting_table
でRALG_BUILD_FUNCTION
とALGO_EXTENSIBLE_LANG
の両方を指定する必要があります。Rスクリプトにより、トレーニング・データに対するdata.frame
の最初の入力引数を含むR関数が定義され、Rモデル・オブジェクトが戻されます。最初のデータ引数は必須です。RALG_BUILD_FUNCTION
は、追加のモデル作成パラメータを受け入れることができます。
注意:
入力パラメータの有効な入力は、数値および文字列のスカラー・データ型です。例25-3 RALG_BUILD_FUNCTIONの例
この例は、model_setting_table
でのモデルの作成に使用されるRスクリプトMY_LM_BUILD_SCRIPT
の名前の指定方法を示しています。
Begin
insert into model_setting_table values
(dbms_data_mining.ralg_build_function,'MY_LM_BUILD_SCRIPT');
End;
/
RスクリプトMY_LM_BUILD_SCRIPT
により、LMモデルを作成するR関数が定義されます。既存のOREセキュリティ制限を使用するRスクリプト・リポジトリにスクリプトMY_LM_BUILD_SCRIPT
を登録する必要があります。Oracle R Enterprise API sys.rqScriptCreate
を使用して、スクリプトを登録できます。Oracle R EnterpriseでRスクリプトを登録するにはRQADMIN
ロールが必要です。
次に例を示します。
Begin
sys.rqScriptCreate('MY_LM_BUILD_SCRIPT', 'function(data, formula, model.frame) {lm(formula = formula, data=data, model = as.logical(model.frame)}');
End;
/
クラスタリングと特徴抽出のマイニング機能のモデル作成では、戻りRモデルでR属性のdm$nclus
およびdm$nfeat
を設定して、クラスタと特徴の数をそれぞれ指定する必要があります。
RスクリプトMY_KM_BUILD_SCRIPT
により、クラスタリング用のk-Meansモデルを作成するR関数が定義されます。R属性dm$nclus
は、戻りクラスタリング・モデル用のクラスタ数で設定されます。
'function(dat) {dat.scaled <- scale(dat)
set.seed(6543); mod <- list()
fit <- kmeans(dat.scaled, centers = 3L)
mod[[1L]] <- fit
mod[[2L]] <- attr(dat.scaled, "scaled:center")
mod[[3L]] <- attr(dat.scaled, "scaled:scale")
attr(mod, "dm$nclus") <- nrow(fit$centers)
mod}'
RスクリプトMY_PCA_BUILD_SCRIPT
により、PCAモデルを作成するR関数が定義されます。R属性dm$nfeat
は、戻り特徴抽出モデル用の特徴数で設定されます。
'function(dat) {
mod <- prcomp(dat, retx = FALSE)
attr(mod, "dm$nfeat") <- ncol(mod$rotation)
mod}'
25.3.5.2.1 RALG_BUILD_PARAMETER
RALG_BUILD_FUNCTION
入力パラメータは、SQL SELECT
問合せ文フォーマットの数値および文字列スカラー値のリストを指定します。
例25-4 RALG_BUILD_PARAMETERの例
RALG_BUILD_FUNCTION
入力パラメータは、数値および文字列のスカラー値のリストである必要があります。入力パラメータはオプションです。
'SELECT value parameter name ...FROM dual'
RALG_BUILD_PARAMETER
を使用して、入力引数'formula'
の式、および入力引数'model.frame'
の数値ゼロを指定する方法を示しています。これらの入力引数は、RALG_BUILD_FUNCTION
パラメータで使用されるRスクリプトの関数シグネチャと一致する必要があります。 Begin
insert into model_setting_table values
(dbms_data_mining.ralg_build_parameter, 'select ''AGE ~ .'' as "formula", 0 as "model.frame" from dual');
End;
/
関連項目
25.3.5.3 RALG_DETAILS_FUNCTION
RALG_DETAILS_FUNCTION
は、data.frame
で戻されるRモデル・メタデータを指定します。
モデル情報を生成する、既存の登録済Rスクリプトの名前を指定するには、RALG_DETAILS_FUNCTION
を使用します。指定されたRスクリプトにより、Rモデル・オブジェクトの最初の入力引数を含むR関数が定義されます。R関数の出力はdata.frame
となる必要があります。data.frame
の列は、RALG_DETAILS_FORMAT
によって定義され、数値または文字列スカラー型のみを含むことができます。
例25-5 RALG_DETAILS_FUNCTIONの例
model_setting_table
のRスクリプトMY_LM_DETAILS_SCRIPT
の名前の指定方法を示しています。このスクリプトにより、モデル情報の提供に使用されるR関数が定義されます。 Begin
insert into model_setting_table values
(dbms_data_mining.ralg_details_function, 'MY_LM_DETAILS_SCRIPT');
End;
/
MY_LM_DETAILS_SCRIPT
は次のように登録されます。 'function(mod) data.frame(name=names(mod$coefficients),
coef=mod$coefficients)'
25.3.5.3.1 RALG_DETAILS_FORMAT
モデル・ビュー内の名前および列タイプを指定するには、RALG_DETAILS_FORMAT
パラメータを使用します。これは、モデル・ビュー列の名前およびタイプの数値および文字列スカラー・データ型のリストを指定するSELECT
問合せを含む文字列です。
RALG_DETAILS_FORMAT
とRALG_DETAILS_FUNCTION
の両方が指定されている場合、名前DM$VD
<model_name>
によるモデル・ビューが、Rモデルとともに現在のスキーマに作成されます。モデル・ビューの最初の列はPARTITION_NAME
です。パーティション化されていないモデルの場合NULL値となります。モデル・ビューの他の列は、RALG_DETATLS_FORMAT
によって定義されます。
例25-6 RALG_DETAILS_FORMATの例
partition_name
の後にvarchar2
列のattr_name
および数値列coef_value
が含まれます。Begin
insert into model_setting_table values
(dbms_data_mining.ralg_details_format, 'select cast(''a'' as varchar2(20)) as attr_name, 0 as coef_value from dual');
End;
/
25.3.5.4 RALG_SCORE_FUNCTION
mining_model_table
のRアルゴリズム・マイニング・モデル・スコアの既存の登録済Rスクリプトを指定するには、RALG_SCORE_FUNCTION
を使用します。
指定したRスクリプトによりR関数が定義されます。最初の入力引数は、モデル・オブジェクトを定義します。2番目の入力引数は、データのスコアリングに使用されるdata.frame
を定義します。
例25-7 RALG_SCORE_FUNCTIONの例
data.frame
でデータをスコアリングする方法を示します。引数オブジェクトは、R線形モデルです。引数newdata
には、data.frame
内のスコアリング・データが含まれます。 function(object, newdata) {res <- predict.lm(object, newdata = newdata, se.fit = TRUE); data.frame(fit=res$fit, se=res$se.fit, df=summary(object)$df[1L])}
この例では、次のようになります
-
object
は、LMモデルを示します -
newdata
は、スコアリングdata.frameを示します
指定したR関数の出力はdata.frame
となる必要があります。各行は、入力data.frame
の対応するスコアリング・データの予測を表しています。data.frame
の列は、次のようにマイニング機能固有です。
回帰: 予測対象のターゲット値の単一の数値列であり、モデル適合の標準誤差および自由度の2つのオプション列があります。オプション列は、問合せ関数PREDICTION_BOUNDS
が動作するために必要です。
例25-8 回帰用のRALG_SCORE_FUNCTIONの例
この例は、model_setting_table
でのモデルのスコアリングに使用されるRスクリプトMY_LM_PREDICT_SCRIPT
の名前の指定方法を示しています。
Begin
insert into model_setting_table values
(dbms_data_mining.ralg_score_function, 'MY_LM_PREDICT_SCRIPT');
End;
/
MY_LM_PREDICT_SCRIPT
は次のように登録されます。 function(object, newdata) {data.frame(pre = predict(object, newdata = newdata))}
分類: 各列は、1つのターゲット・クラスの予測確率を表します。列名は、ターゲット・クラス名です。
例25-9 分類用のRALG_SCORE_FUNCTIONの例
この例は、model_setting_table
でのロジット分類モデルのスコアリングに使用されるRスクリプトMY_LOGITGLM_PREDICT_SCRIPT
の名前の指定方法を示しています。
Begin
insert into model_setting_table values
(dbms_data_mining.ralg_score_function, 'MY_LOGITGLM_PREDICT_SCRIPT');
End;
/
MY_LOGITGLM_PREDICT_SCRIPT
は次のように登録されます。これは、"0"と "1"の2つのターゲット・クラスを持つロジット分類です。'function(object, newdata) {
pred <- predict(object, newdata = newdata, type="response");
res <- data.frame(1-pred, pred);
names(res) <- c("0", "1");
res}'
クラスタリング: 各列は、1つのクラスタの予測確率を表します。列は、クラスタIDの順に並べられます。各クラスタにはクラスタIDが割り当てられ、これは1から始まる連続した値です。RモデルでCLUSTER_DISTANCE
をサポートするには、Rスコア・ファンクションの出力は、予測確率の列の後に、クラスタIDの順で各クラスタへの距離の値を含む追加列を戻します。
例25-10 クラスタリング用のRALG_SCORE_FUNCTIONの例
この例は、model_setting_table
でのモデルのスコアリングに使用されるRスクリプトMY_CLUSTER_PREDICT_SCRIPT
の名前の指定方法を示しています。
Begin
insert into model_setting_table values
(dbms_data_mining.ralg_score_function, 'MY_CLUSTER_PREDICT_SCRIPT');
End;
/
MY_CLUSTER_PREDICT_SCRIPT
は次のように登録されます。'function(object, dat){
mod <- object[[1L]]; ce <- object[[2L]]; sc <- object[[3L]];
newdata = scale(dat, center = ce, scale = sc);
centers <- mod$centers;
ss <- sapply(as.data.frame(t(centers)),
function(v) rowSums(scale(newdata, center=v, scale=FALSE)^2));
if (!is.matrix(ss)) ss <- matrix(ss, ncol=length(ss));
disp <- -1 / (2* mod$tot.withinss/length(mod$cluster));
distr <- exp(disp*ss);
prob <- distr / rowSums(distr);
as.data.frame(cbind(prob, sqrt(ss)))}'
特徴抽出: 各列は、1つの特徴の係数値を表します。列は、特徴IDの順に並べられます。各特徴には特徴IDが割り当てられ、これは1から始まる連続した値です。
例25-11 特徴抽出用のRALG_SCORE_FUNCTIONの例
この例は、model_setting_table
でのモデルのスコアリングに使用されるRスクリプトMY_FEATURE_EXTRACTION_SCRIPT
の名前の指定方法を示しています。
Begin
insert into model_setting_table values
(dbms_data_mining.ralg_score_function, 'MY_FEATURE_EXTRACTION_SCRIPT');
End;
/
MY_FEATURE_EXTRACTION_SCRIPT
は次のように登録されます。 'function(object, dat) { as.data.frame(predict(object, dat)) }'
この関数は、Rモデルから特徴の中央値をフェッチし、スコア・データから対応する特徴の中央値への距離に基づいて、特徴の係数を計算します。
関連項目
25.3.5.5 RALG_WEIGHT_FUNCTION
スコアリング内の各属性の重みまたは寄与率を計算する、既存の登録済Rスクリプトの名前を指定するには、RALG_WEIGHT_FUNCTION
を使用します。指定したRスクリプトは、問合せ関数PREDICTION_DETAILS
で、属性の寄与率を評価するために使用されます。
指定したRスクリプトは、モデル・オブジェクトの最初の入力引数、およびスコアリング・データのdata.frame
の2番目の入力引数を含むR関数を定義します。マイニング機能が分類、クラスタリングまたは特徴抽出の場合、ターゲット・クラス名、クラスタIDまたは特徴IDが3番目の入力引数によって渡され、その特定のクラス、クラスタまたは特徴の重みが計算されます。スクリプトにより、各属性の影響を与える重みが行内に含まれるdata.frame
が戻されます。各行は、その入力スコアリングdata.frame
に対応しています。
例25-12 RALG_WEIGHT_FUNCTIONの例
model_setting_table
でのRモデル属性の重みまたは寄与率を計算するRスクリプトMY_PREDICT_WEIGHT_SCRIPT
の名前の指定方法を示しています。Begin
insert into model_setting_table values
(dbms_data_mining.ralg_weight_function, 'MY_PREDICT_WEIGHT_SCRIPT');
End;
/
MY_PREDICT_WEIGHT_SCRIPT
は次のように登録されます。'function(mod, data) { coef(mod)[-1L]*data }'
MY_PREDICT_WEIGHT_SCRIPT
は次のように登録されます。'function(mod, dat, clas) {
v <- predict(mod, newdata=dat, type = "response");
v0 <- data.frame(v, 1-v); names(v0) <- c("0", "1");
res <- data.frame(lapply(seq_along(dat),
function(x, dat) {
if(is.numeric(dat[[x]])) dat[,x] <- as.numeric(0)
else dat[,x] <- as.factor(NA);
vv <- predict(mod, newdata = dat, type = "response");
vv = data.frame(vv, 1-vv); names(vv) <- c("0", "1");
v0[[clas]] / vv[[clas]]}, dat = dat));
names(res) <- names(dat);
res}'
関連項目
25.3.5.6 登録済Rスクリプト
RALG_*_FUNCTION
は、Rスクリプト・リポジトリ内に存在するRスクリプトを指定する必要があります。Rスクリプトは、Oracle R Enterpriseを使用すると登録できます。
RALG_*_FUNCTION
には、次の機能があります。
-
RALG_BUILD_FUNCTION
-
RALG_DETAILS_FUNCTION
-
RALG_SCORE_FUNCTION
-
RALG_WEIGHT_FUNCTION
注意:
Rモデルが機能するためには、RスクリプトがRスクリプト・リポジトリに存在する必要があります。Rスクリプトは、Oracle Enterprise R (ORE)を通じて登録できます。Rスクリプトを登録するには、RQADMIN
ロールが必要です。Rモデルを作成したら、この指定したRスクリプトの名前がモデルの設定になります。Rモデルが機能し続けるためには、このRスクリプトがRスクリプト・リポジトリに存在する必要があります。
Rモデルを作成、スコアリングおよび表示するために使用されるRメモリーも、Oracle Enterprise Rで管理できます。
25.4 モデルの詳細ビュー
GET_*
インタフェースはモデル・ビューに置き換えられるため、かわりにこのビューを利用することをお薦めします。
次に、新しいモデル・ビューを示します。
相関:
分類、回帰、異常検出:
クラスタリング:
特徴抽出:
特徴選択:
データの準備およびその他:
25.4.1 相関ルールのモデル・ディテール・ビュー
相関ルールのモデル・ディテール・ビューは、相関ルールのルール・ビューを説明しています。GET_ASSOCIATION_RULES
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
ルール・ビューDM$VR
model_nameは、相関ルールに対して生成されたルールを説明しています。モデルの設定によって、ルールの列セットは異なります。次のビューは、トランザクショナルおよび2次元の入力に対する集計なしで異なるグローバル設定が適用されたときに表示されます。
ASSO_AGGREGATES設定のないトランザクショナル入力
ODMS_ITEM_ID_COLUMN_NAME
が設定され、ITEM_VALUE
(ODMS_ITEM_VALUE_COLUMN_NAME
)が設定されていない場合、トランザクショナル・ビューは次のようになります。Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
RULE_ID NUMBER
RULE_SUPPORT NUMBER
RULE_CONFIDENCE NUMBER
RULE_LIFT NUMBER
RULE_REVCONFIDENCE NUMBER
ANTECEDENT_SUPPORT NUMBER
NUMBER_OF_ITEMS NUMBER
CONSEQUENT_SUPPORT NUMBER
CONSEQUENT_NAME VARCHAR2(4000)
ANTECEDENT SYS.XMLTYPE
表25-11 トランザクショナル入力のルール・ビュー列
列名 | 説明 |
---|---|
|
詳細を取得するパーティション化されたモデルのパーティション |
|
ターゲットの名前または識別子 |
|
ルールを満たすトランザクションの数。 |
|
トランザクションがルールを満たす確度。 |
|
ルールが満たされた場合に、ランダムな可能性を上回る予測の改善の程度。 |
|
ルールが発生するトランザクションの数を後件が発生するトランザクションの数で割ったもの。 |
|
トランザクションの合計数に対する、前件を満たすトランザクションの数の割合。 |
|
ルールの前件と後件で参照される属性の合計数。 |
|
トランザクションの合計数に対する、後件を満たすトランザクションの数の割合。 |
|
後件の名前 |
|
2次元の入力の場合、 2次元入力では、 ビューでは、後件用に3列が使用されます。ルール・ビューには次の列があります。
注意: 3つの部分のすべての型はVARCHAR2 です。ASSO_AGGREGATES が設定されている場合、この列は適用されません。
|
|
次のビューでは、
次のビューでは、
|
|
ルール内の独立の条件。この条件が存在する場合は、後件に依存条件も存在します。条件は、述語(
注意: DM_PREDICATE 属性があることは、トランザクションに項目が存在することを示しています。attribute_num_value またはattribute_str_value の実際の値に意味はありません。たとえば、次の述語は、属性値がNULLでもトランザクションにMouse Padが存在していることを示しています。
|
ASSO_AGGREGATES設定があるトランザクショナル入力
-
ODMS_ITEM_ID_COLUMN_NAME
が設定されていて、Item_value
(ODMS_ITEM_VALUE_COLUMN_NAME
)が設定されていない場合のルール・ビュー。 -
ODMS_ITEM_ID_COLUMN_NAME
が設定されていて、Item_value
(ODMS_ITEM_VALUE_COLUMN_NAME
)が量的のTYPE
で設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE
列があります。 -
ODMS_ITEM_ID_COLUMN_NAME
が設定されていて、Item_value
(ODMS_ITEM_VALUE_COLUMN_NAME
)が質的のTYPE
で設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE
列があります。
ASSO_AGGREGATES
を含むビューには、集計出力の列(集計当たり4列)があります。2次元入力では、集計設定は許可されません。
例25-13 例
次の例は、集計対象として設定されている利益と売上を示しています。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
RULE_ID NUMBER
RULE_SUPPORT NUMBER
RULE_CONFIDENCE NUMBER
RULE_LIFT NUMBER
RULE_REVCONFIDENCE NUMBER
ANTECEDENT_SUPPORT NUMBER
NUMBER_OF_ITEMS NUMBER
CONSEQUENT_SUPPORT NUMBER
CONSEQUENT_NAME VARCHAR2(4000)
ANTECEDENT SYS.XMLTYPE
ANT_RULE_PROFIT BINARY_DOUBLE
CON_RULE_PROFIT BINARY_DOUBLE
ANT_PROFIT BINARY_DOUBLE
CON_PROFIT BINARY_DOUBLE
ANT_RULE_SALES BINARY_DOUBLE
CON_RULE_SALES BINARY_DOUBLE
ANT_SALES BINARY_DOUBLE
CON_SALES BINARY_DOUBLE
ODMS_ITEM_ID_COLUMN_NAME
が設定されていて、Item_value
(ODMS_ITEM_VALUE_COLUMN_NAME
)が量的のTYPE
で設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE
列があります。Name Null? Type
----------------------------------------- -------- ----------------------------
PARTITION_NAME VARCHAR2(128)
RULE_ID NUMBER
RULE_SUPPORT NUMBER
RULE_CONFIDENCE NUMBER
RULE_LIFT NUMBER
RULE_REVCONFIDENCE NUMBER
ANTECEDENT_SUPPORT NUMBER
NUMBER_OF_ITEMS NUMBER
CONSEQUENT_SUPPORT NUMBER
CONSEQUENT_NAME VARCHAR2(4000)
CONSEQUENT_VALUE NUMBER
ANTECEDENT SYS.XMLTYPE
ANT_RULE_PROFIT BINARY_DOUBLE
CON_RULE_PROFIT BINARY_DOUBLE
ANT_PROFIT BINARY_DOUBLE
CON_PROFIT BINARY_DOUBLE
ANT_RULE_SALES BINARY_DOUBLE
CON_RULE_SALES BINARY_DOUBLE
ANT_SALES BINARY_DOUBLE
CON_SALES BINARY_DOUBLE
ODMS_ITEM_ID_COLUMN_NAME
が設定されていて、Item_value
(ODMS_ITEM_VALUE_COLUMN_NAME
)が質的のTYPE
で設定されている場合のルール・ビュー。ビューには、CONSEQUENT_VALUE
列があります。
Name Null? Type
----------------------------------------- -------- ----------------------------
PARTITION_NAME VARCHAR2(128)
RULE_ID NUMBER
RULE_SUPPORT NUMBER
RULE_CONFIDENCE NUMBER
RULE_LIFT NUMBER
RULE_REVCONFIDENCE NUMBER
ANTECEDENT_SUPPORT NUMBER
NUMBER_OF_ITEMS NUMBER
CONSEQUENT_SUPPORT NUMBER
CONSEQUENT_NAME VARCHAR2(4000)
CONSEQUENT_VALUE VARCHAR2(4000)
ANTECEDENT SYS.XMLTYPE
ANT_RULE_PROFIT BINARY_DOUBLE
CON_RULE_PROFIT BINARY_DOUBLE
ANT_PROFIT BINARY_DOUBLE
CON_PROFIT BINARY_DOUBLE
ANT_RULE_SALES BINARY_DOUBLE
CON_RULE_SALES BINARY_DOUBLE
ANT_SALES BINARY_DOUBLE
CON_SALES BINARY_DOUBLE
相関ルールのグローバルな詳細
単一のグローバルな詳細は、相関モデルによって生成されます。次の表は、相関ルール・モデルに対して戻されるグローバルな詳細について説明しています。
表25-12 相関ルールのグローバルな詳細
名前 | 説明 |
---|---|
|
生成された項目セットの数 |
|
最大サポート |
|
ビルドで使用される合計行数 |
|
生成されるモデル内の相関ルールの数 |
|
入力データのトランザクションの数 |
25.4.2 高頻度項目セットのモデル・ディテール・ビュー
高頻度項目セットのモデル・ディテール・ビューは、高頻度項目セット・ビューを説明しています。GET_FREQUENT_ITEMSETS
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
高頻度項目セット・ビューDM$VI
model_nameには、次のスキーマがあります。
Name Type
------------- ------------------
PARTITION_NAME VARCHAR2 (128)
ITEMSET_ID NUMBER
SUPPORT NUMBER
NUMBER_OF_ITEMS NUMBER
ITEMSET SYS.XMLTYPE
表25-13 高頻度項目ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション |
|
項目セット識別子 |
|
項目セットのサポート |
|
項目セット内の項目の数 |
|
高頻度項目セット
|
25.4.3 トランザクショナル項目セットのモデル・ディテール・ビュー
トランザクショナル項目セットのモデル・ディテール・ビューは、トランザクショナル項目セット・ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。
集計のないトランザクショナル・データのよくあるケースとして、DM$VT
model_nameビューは、トランザクショナル形式の項目セット情報を提供します。このビューは、XML列を含むビューと比較して、一部の問合せのパフォーマンスの向上に役立ちます。トランザクショナル項目セット・ビューには次のスキーマがあります。
Name Type
----------------- -----------------
PARTITION_NAME VARCHAR2(128)
ITEMSET_ID NUMBER
ITEM_ID NUMBER
SUPPORT NUMBER
NUMBER_OF_ITEMS NUMBER
ITEM_NAME VARCHAR2(4000)
表25-14 トランザクショナル項目セット・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション |
|
項目セット識別子 |
|
項目識別子 |
|
項目セットのサポート |
|
項目セット内の項目の数 |
|
アイテムの名前 |
25.4.4 トランザクショナル・ルールのモデル・ディテール・ビュー
トランザクショナル・ルールのモデル・ディテール・ビューは、トランザクショナル・ルール・ビューおよびトランザクショナル項目セット・ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。
集計のないトランザクショナル・データには、トランザクショナル・ルール・ビューDM$VA
model_nameもあります。このビューにより、XML列を含むビューと比較して、一部の問合せのパフォーマンスの向上を図れます。トランザクショナル・ルール・ビューには次のスキーマがあります。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
RULE_ID NUMBER
ANTECEDENT_PREDICATE VARCHAR2(4000)
CONSEQUENT_PREDICATE VARCHAR2(4000)
RULE_SUPPORT NUMBER
RULE_CONFIDENCE NUMBER
RULE_LIFT NUMBER
RULE_REVCONFIDENCE NUMBER
RULE_ITEMSET_ID NUMBER
ANTECEDENT_SUPPORT NUMBER
CONSEQUENT_SUPPORT NUMBER
NUMBER_OF_ITEMS NUMBER
表25-15 トランザクショナル・ルール・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション |
|
ルール識別子 |
|
前件項目の名前。 |
|
後件項目の名前 |
|
ルールのサポート |
|
前件が含まれる場合にトランザクションがルールを満たす確度。 |
|
ルールが満たされた場合に、ランダムな可能性を上回る予測の改善の程度 |
|
ルールが発生するトランザクションの数を後件が発生するトランザクションの数で割ったもの |
|
項目セット識別子 |
|
トランザクションの合計数に対する、前件を満たすトランザクションの数の割合 |
|
トランザクションの合計数に対する、後件を満たすトランザクションの数の割合 |
|
ルール内の項目の数 |
25.4.5 分類アルゴリズムのモデル・ディテール・ビュー
分類アルゴリズムのモデル・ディテール・ビューは、すべての分類アルゴリズムに適用されるターゲット・マップ・ビューおよびスコアリング・コスト・ビューを説明しています。GET_*
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
ターゲット・マップ・ビューDM$VT
model_nameは、分類モデルに対するターゲット分布を説明しています。このビューには次のスキーマが含まれます。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
TARGET_VALUE NUMBER/VARCHAR2
TARGET_COUNT NUMBER
TARGET_WEIGHT NUMBER
表25-16 ターゲット・マップ・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
ターゲット値(量的または質的) |
|
特定の |
|
特定の |
スコアリング・コスト・ビューDM$VC
model_nameは、分類モデルに対するスコアリング・コスト・マトリックスを説明しています。このビューには次のスキーマが含まれます。
Name Type
----------------------------------------- --------------------------------
PARTITION_NAME VARCHAR2(128)
ACTUAL_TARGET_VALUE NUMBER/VARCHAR2
PREDICTED_TARGET_VALUE NUMBER/VARCHAR2
COST NUMBER
表25-17 スコアリング・コスト・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
有効なターゲット値 |
|
予測対象ターゲット値 |
|
実際のターゲット値と予測されたターゲット値のペアに対して関連付けられたコスト |
25.4.6 ディシジョン・ツリーのモデル・ディテール・ビュー
ディシジョン・ツリーのモデル・ディテール・ビューは、分岐情報ビュー、ノード統計ビュー、ノード説明ビューおよびコスト・マトリックス・ビューを説明しています。GET_MODEL_DETAILS_XML
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
分岐情報ビューDM$VP
model_nameは、ディシジョン・ツリー内の各レベルのツリー階層および分岐情報を説明しています。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ---------------------------
PARTITION_NAME VARCHAR2(128)
PARENT NUMBER
SPLIT_TYPE VARCHAR2
NODE NUMBER
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
OPERATOR VARCHAR2
VALUE SYS.XMLTYPE
表25-18 分岐情報ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
親のノードID |
|
メイン分岐またはサロゲート分岐 |
|
ノードID |
|
このノードを生成するために、親ノードで分岐基準として使用される属性。 |
|
分岐属性のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
分岐演算子 |
|
分岐基準として使用される値。これは、 たとえば、 |
ノード統計ビューDM$VI
model_nameは、個々のツリー・ノードに関連付けられている統計を説明しています。統計には、ノード内のデータのターゲット・ヒストグラムが含まれます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
NODE NUMBER
NODE_SUPPORT NUMBER
PREDICTED_TARGET_VALUE NUMBER/VARCHAR2
TARGET_VALUE NUMBER/VARCHAR2
TARGET_SUPPORT NUMBER
表25-19 ノード統計ビュー
パラメータ | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
ノードID |
|
ノードに属するトレーニング・セット内のレコード数 |
|
予測対象ターゲット値 |
|
トレーニング・データ内に表示されるターゲット値 |
|
ノードに属し、 |
より高いレベルのノードの説明が、DM$VO
model_nameビューに表示されます。DM$VO
model_nameには、次のスキーマがあります。
ame Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
NODE NUMBER
NODE_SUPPORT NUMBER
PREDICTED_TARGET_VALUE NUMBER/VARCHAR2
PARENT NUMBER
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
OPERATOR VARCHAR2
VALUE SYS.XMLTYPE
表25-20 ノードの説明ビュー
パラメータ | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
ノードID |
|
ノードに属するトレーニング・セット内のレコード数 |
|
予測対象ターゲット値 |
|
親のID |
|
属性名を指定します |
|
属性サブ名を指定します |
|
属性述語演算子 - 次の値を使用する条件演算子。 IN、=、<>、< 、>、<=および>= |
|
説明の基準として使用される値。これは、 たとえば、 |
DM$VM
model_nameビューは、ディシジョン・ツリーの作成によって使用されるコスト・マトリックスを説明しています。DM$VM
model_nameビューには、次のスキーマがあります。
Name Type
----------------------------------------- --------------------------------
PARTITION_NAME VARCHAR2(128)
ACTUAL_TARGET_VALUE NUMBER/VARCHAR2
PREDICTED_TARGET_VALUE NUMBER/VARCHAR2
COST NUMBER
表25-21 コスト・マトリックス・ビュー
パラメータ | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
有効なターゲット値 |
|
予測対象ターゲット値 |
|
実際のターゲット値と予測されたターゲット値のペアに対して関連付けられたコスト |
表25-22 モデル・グローバル・ビューのディシジョン・ツリー統計情報
名前 | 説明 |
---|---|
|
ビルドで使用される合計行数 |
25.4.7 一般化線形モデルのモデル・ディテール・ビュー
一般化線形モデル(GLM)のモデル・ディテール・ビューは、線形およびロジスティック回帰のモデル・ディテール・ビューおよび行診断ビューを説明します。GET_MODEL_DETAILS_GLM
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
モデル・ディテール・ビューDM$VD
model_nameは、線形回帰モデルとロジスティック回帰モデルの両方の最終モデル情報を説明しています。
線形回帰の場合、DM$VD
model_nameには、次のスキーマがあります。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
FEATURE_EXPRESSION VARCHAR2(4000)
COEFFICIENT BINARY_DOUBLE
STD_ERROR BINARY_DOUBLE
TEST_STATISTIC BINARY_DOUBLE
P_VALUE BINARY_DOUBLE
VIF BINARY_DOUBLE
STD_COEFFICIENT BINARY_DOUBLE
LOWER_COEFF_LIMIT BINARY_DOUBLE
UPPER_COEFF_LIMIT BINARY_DOUBLE
ロジスティック回帰の場合、DM$VD
model_nameには、次のスキーマがあります。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
TARGET_VALUE NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
FEATURE_EXPRESSION VARCHAR2(4000)
COEFFICIENT BINARY_DOUBLE
STD_ERROR BINARY_DOUBLE
TEST_STATISTIC BINARY_DOUBLE
P_VALUE BINARY_DOUBLE
STD_COEFFICIENT BINARY_DOUBLE
LOWER_COEFF_LIMIT BINARY_DOUBLE
UPPER_COEFF_LIMIT BINARY_DOUBLE
EXP_COEFFICIENT BINARY_DOUBLE
EXP_LOWER_COEFF_LIMIT BINARY_DOUBLE
EXP_UPPER_COEFF_LIMIT BINARY_DOUBLE
表25-23 線形およびロジスティック回帰モデルのモデル・ビュー
列名 | 説明 |
---|---|
|
モデル内の特徴の名前 |
|
有効なターゲット値 |
|
サブ名がない場合は属性名、サブ名がある場合は属性名の最初の部分。 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 ネストした列が数値の場合、マイニング属性は、 |
|
質的列またはネストした質的列とみなすことができる一意の値。質的列では、マイニング属性は、一意の |
|
特徴選択が有効な場合、アルゴリズムによって作成される特徴名です。特徴選択が有効でない場合、この特徴名は、単に完全修飾された属性名になります(属性がネストした列内にあるときはattribute_name.attribute_subnameになる)。質的属性では、次のような形式の特徴名が作成されます。 fully-qualified_attribute_name.attribute_value 特徴生成が有効な場合、モデル内の用語は、単一のマイニング属性または最大3つのマイニング属性の積となります。コンポーネント・マイニング属性は、単一の用語内で繰り返すことができます。特徴生成が有効ではない場合、または特徴生成が有効であるが、複数のコンポーネントの用語が 注意: Oracle Database 12cリリース2では、アルゴリズムによって、量的コンポーネントから平均が減算されません。 |
|
推定係数。 |
|
係数推定値の標準誤差。 |
|
線形回帰の場合、係数推定値のt値。 ロジスティック回帰の場合、係数推定値のWaldカイ二乗値。 |
|
モデル内の用語が統計的に重要ではない(NULL)仮定の下の |
|
分散拡大要因。切片の場合、この値はゼロです。ロジスティック回帰の場合、 |
|
係数の標準化推定値。 |
|
係数の信頼限界値の下限。 |
|
係数の信頼限界値の上限。 |
|
ロジスティック回帰の場合は指数係数線形 回帰の場合、 |
|
ロジスティック回帰の場合、係数の信頼限界値の下限に対する指数係数。線形回帰の場合、 |
|
ロジスティック回帰の場合、係数の信頼限界値の上限に対する指数係数。線形回帰の場合、 |
行診断ビューDM$VA
model_nameは、線形回帰モデルとロジスティック回帰モデルの両方の行レベル情報を説明しています。線形回帰の場合、DM$VA
model_nameには、次のスキーマがあります。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CASE_ID NUMBER/VARHCAR2
TARGET_VALUE BINARY_DOUBLE
PREDICTED_TARGET_VALUE BINARY_DOUBLE
Hat BINARY_DOUBLE
RESIDUAL BINARY_DOUBLE
STD_ERR_RESIDUAL BINARY_DOUBLE
STUDENTIZED_RESIDUAL BINARY_DOUBLE
PRED_RES BINARY_DOUBLE
COOKS_D BINARY_DOUBLE
表25-24 線形回帰の行診断ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
ケースIDの名前 |
|
入力行から取得される実際のターゲット値 |
|
行のモデル予測ターゲット値 |
|
ハット・マトリックスによって特定の入力行で識別されるn*n (n=行数)の対角線上の要素。入力データのモデル予測は、ハット・マトリックスと入力ターゲット値のベクターの積です。対角線上の要素(ハット値)は、i番目の適合した値上のi番目の行の影響を表します。大きいハット値は、i番目の行が影響力の大きいポイントであり、潜在的な外れ値であることを示すインジケータです。 |
|
特定の入力行の予測と実際のターゲット値間の差異。 |
|
標準残余誤差(ステューデント化残差とも呼ばれる)は、入力行の残差を比較可能にするために、残差を再スケーリングしてすべての入力行にわたる定数分散を得ます。このプロセスは、残差を行の重さの平方根で乗算し、平均平方誤差の積およびハット値から1減算した値で除算します。 |
|
スチューデント化削除残差は、現在の行の影響のために、標準残余誤差を調整します。 |
|
予測残差は、削除残差の重み付きの2乗であり、行の重みを残差の2乗で乗算し、ハット値から1を減算した値で除算して算出されます。 |
|
クックの距離は、すべての推定回帰係数上のi番目のケースの複合的影響のメジャーです。 |
ロジスティック回帰の場合、DM$VA
model_nameには、次のスキーマがあります。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CASE_ID NUMBER/VARHCAR2
TARGET_VALUE NUMBER/VARCHAR2
TARGET_VALUE_PROB BINARY_DOUBLE
Hat BINARY_DOUBLE
WORKING_RESIDUAL BINARY_DOUBLE
PEARSON_RESIDUAL BINARY_DOUBLE
DEVIANCE_RESIDUAL BINARY_DOUBLE
C BINARY_DOUBLE
CBAR BINARY_DOUBLE
DIFDEV BINARY_DOUBLE
DIFCHISQ BINARY_DOUBLE
表25-25 ロジスティック回帰の行診断ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
ケースIDの名前 |
|
入力行から取得される実際のターゲット値 |
|
予測ターゲット値の確率のモデル推定値。 |
|
線形回帰のハット値の概念は、線形回帰ハッチ値をロジスティック回帰の分散関数で乗算することでロジスティック回帰に拡張され、予測確率は、予測確率から1を減算した値で乗算されます。 |
|
作業残差は、作業応答の残差です。作業応答は、線形化スケール上の応答です。ロジスティック回帰の場合、i番目の行の残差がi番目の行の予測の分散で除算される形式となります。予測の分散は、予測確率を予測確率から1を減算した値で乗算し算出されます。
|
|
ピアソン残差は、重みを考慮した、作業残差の再スケーリングされたバージョンです。ロジスティック回帰の場合、ピアソン残差は、残差を、重み平方根として計算される係数で乗算し、i番目の行の予測確率の分散で除算し算出されます。
|
|
|
|
削除されたもの(i番目のポイント)を含む、すべてのポイントに対するi番目の観察の削除による、適合ロジット内の変更全体を測定します。これは、ピアソン残差の2乗をハット値で乗算し、ハット値から1減算した値の2乗で除算して算出されます。 個々の観察による影響のスカラー測定を提供する、信頼区間の置換診断。 |
|
C およびCBAR は、ロジスティック回帰のクックの距離の拡張です。CBAR は、削除されたもの(i番目のポイント)を除く、すべてのポイントに対するi番目の観察の削除による、適合ロジット内の変更全体を測定します。これは、ピアソン残差の2乗をハット値で乗算し、(ハット値から1減算した値)で除算して算出されます。
個々の観察の削除による影響を測定する、信頼区間の置換診断。 |
|
観測値が入力から削除されたときに発生する逸脱度の変化を測定する統計。逸脱度残差の2乗に |
|
観測値が入力から削除されたときに発生するピアソンのカイ二乗の変化を測定する統計。 |
GLMのグローバルな詳細: 線形回帰
次の表は、線形回帰モデルによって戻されるグローバルな詳細について説明しています。
表25-26 線形回帰のグローバルな詳細
名前 | 説明 |
---|---|
|
調整済R2乗 |
|
赤池情報量基準 |
|
変動の係数 |
|
モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。
|
|
修正された総自由度。 |
|
修正された総平方和。 |
|
依存平均 |
|
誤差の自由度。 |
|
誤差平均平方 |
|
誤差の平方和。 |
|
モデルのF値の統計。 |
|
予測の推定平均平方誤差。多変量正規性を想定しています。 |
|
HockingのSp統計 |
|
SGD反復数を追跡します。ソルバーがSGDの場合にのみ適用できます。 |
|
JP統計(最終予測誤差)。 |
|
モデルの自由度。 |
|
モデルのF値の確率。 |
|
モデルの平均平方誤差 |
|
モデルの平方和誤差 |
|
パラメータ数(切片を含む係数の数)。 |
|
行数 |
|
R2乗 |
|
多重共線性のためにモデルから除外された予測子の数 |
|
2乗平均平方根誤差。 |
|
Schwarzのベイズ情報量基準。 |
GLMのグローバルな詳細: ロジスティック回帰
次の表は、ロジスティック回帰モデルによって戻されるグローバルな詳細を示しています。
表25-27 ロジスティック回帰のグローバルな詳細
名前 | 説明 |
---|---|
|
切片のみのベースライン・モデルの適合度に関する赤池の基準 |
|
切片および共変量(予測子)モデルの適合度に関する赤池の基準。 |
|
モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。
|
|
依存平均 |
|
SGD反復数(IRLS反復数)を追跡します。ソルバーがSGDの場合にのみ適用できます。 |
|
尤度比の自由度。 |
|
尤度比のカイ二乗値。 |
|
尤度比のカイ二乗確率値。 |
|
切片のみのベースライン・モデルの-2対数尤度 |
|
モデルの-2対数尤度。 |
|
パラメータ数(切片を含む係数の数)。 |
|
行数 |
|
正確な予測の割合。 |
|
不正確に予測された行の割合。 |
|
両方のターゲット・クラスの推定確率が等しくなる割合 |
|
擬似R二乗(CoxおよびSnell) |
|
擬似R2乗(Nagelkerke) |
|
多重共線性のためにモデルから除外された予測子の数 |
|
切片のみのベースライン・モデルの適合度に関するシュワルツの基準 |
|
切片および共変量(予測子)モデルの適合度に関するSchwarzの基準。 |
注意:
-
「リッジ回帰」が有効な場合、戻されるグローバルな詳細がより少なくなります。リッジの詳細は、『Oracle Data Mining概要』を参照してください。
-
パーティション化されたモデルで値が
NULL
の場合、例外がスローされます。値がNULLでない場合、目的のパーティション名が含まれる必要があります。
25.4.8 Naive Bayesのモデル・ディテール・ビュー
Naive Bayesのモデル・ディテール・ビューは、事前のビューおよび結果ビューを説明しています。GET_MODEL_DETAILS_NB
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
事前ビューDM$VP
model_nameは、Naïve Bayesに対するターゲットの事前の状態を説明しています。このビューには次のスキーマが含まれます。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
TARGET_NAME VARCHAR2(128)
TARGET_VALUE NUMBER/VARCHAR2
PRIOR_PROBABILITY BINARY_DOUBLE
COUNT NUMBER
表25-28 Naive Bayesの事前ビュー
列名 | 説明 |
---|---|
|
モデル内の特徴の名前 |
|
ターゲット列の名前 |
|
ターゲット値(量的または質的) |
|
特定の |
|
特定の |
Naïve Bayes結果ビューDM$VV
model_viewは、Naïve Bayesモデルの条件付き確率を説明しています。このビューには次のスキーマが含まれます。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
TARGET_NAME VARCHAR2(128)
TARGET_VALUE NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
CONDITIONAL_PROBABILITY BINARY_DOUBLE
COUNT NUMBER
表25-29 Naive Bayesの結果ビュー
列名 | 説明 |
---|---|
|
モデル内の特徴の名前 |
|
ターゲット列の名前 |
|
ターゲット値(量的または質的) |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
列 |
|
特定のターゲットのマイニング属性の条件付き確率 |
|
特定のマイニング属性および特定のターゲットの行数 |
表25-30 モデル・グローバル・ビューのNaive Bayes統計情報
名前 | 説明 |
---|---|
|
ビルドで使用される合計行数 |
25.4.9 サポート・ベクター・マシンのモデル・ディテール・ビュー
サポート・ベクター・マシンのモデル・ディテール・ビューは、線形係数ビューを説明しています。GET_MODEL_DETAILS_SVM
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
線形係数ビューDM$VL
model_nameは、線形SVMアルゴリズムの係数を説明しています。ビューのtarget_valueフィールドは分類にのみ存在し、ターゲットの型を持ちます。回帰モデルにはtarget_valueフィールドがありません。
reversed_coefficientフィールドは、自動データ準備変換を元に戻した後の係数の値が表示されます。データ準備が無効な場合、coefficientとreversed_coefficientの値は同じになります。このビューには次のスキーマが含まれます。
Name Type
----------------------------------------- --------------------------------
PARTITION_NAME VARCHAR2(128)
TARGET_VALUE NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
COEFFICIENT BINARY_DOUBLE
REVERSED_COEFFICIENT BINARY_DOUBLE
表25-31 サポート・ベクター・マシンの線形係数ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
ターゲット値(量的または質的) |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
質的属性の値 |
|
予測係数値 |
|
元のスケールで変換された係数 |
表25-32モデル・グローバル・ビューのサポート・ベクター統計情報
名前 | 説明 |
---|---|
|
モデル作成プロセスが指定された許容値に収束したかどうかを示します。
|
|
作成中の反復回数 |
|
作成で使用される行の数 |
|
標準が0のために削除された行の数。このことは、1つのクラスの線形モデルにのみ適用されます。 |
25.4.10 クラスタリング・アルゴリズムのモデル・ディテール・ビュー
Oracle Data Miningは、期待値最大化、k-Meansおよび直交パーティショニング・クラスタリング(O-Cluster)などのクラスタリング・アルゴリズムをサポートしています。
すべてのクラスタリング・アルゴリズムで、次のビューが共有されます。
-
クラスタ説明
DM$VD
model_name -
属性統計
DM$VA
model_name -
ヒストグラム統計
DM$VH
model_name -
ルール統計
DM$VR
model_name
クラスタ説明ビューDM$VD
model_nameは、クラスタリング・モデルのクラスタ・レベル情報を説明しています。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CLUSTER_ID NUMBER
CLUSTER_NAME NUMBER/VARCHAR2
RECORD_COUNT NUMBER
PARENT NUMBER
TREE_LEVEL NUMBER
LEFT_CHILD_ID NUMBER
RIGHT_CHILD_ID NUMBER
表25-33 クラスタリング・アルゴリズムのクラスタ説明ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
モデル内のクラスタのID |
|
クラスタのラベルを指定します |
|
レコードの数を指定します。 |
|
親のID |
|
ルートからの分岐の数を指定します。 |
|
分岐の左側の子クラスタのID |
|
分岐の右側の子クラスタのID |
属性ビューDM$VA
model_nameは、クラスタリング・モデルの属性レベル情報を説明しています。特定のクラスタの平均、分散およびモードの値は、このビューから取得できます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CLUSTER_ID NUMBER
CLUSTER_NAME NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
MEAN BINARY_DOUBLE
VARIANCE BINARY_DOUBLE
MODE_VALUE VARCHAR2(4000)
表25-34 クラスタリング・アルゴリズムの属性ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション |
|
モデル内のクラスタのID |
|
クラスタのラベルを指定します |
|
属性名を指定します |
|
属性サブ名を指定します |
|
このフィールドにより、数値属性の平均値が戻されます |
|
数値属性の分散 |
|
モードとは、質的属性の最頻値です。 |
ヒストグラム・ビューDM$VH
model_nameは、クラスタリング・モデルのヒストグラム・レベル情報を説明しています。ビン情報およびビン数は、このビューから取得できます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CLUSTER_ID NUMBER
CLUSTER_NAME NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
BIN_ID NUMBER
LOWER_BIN_BOUNDARY BINARY_DOUBLE
UPPER_BIN_BOUNDARY BINARY_DOUBLE
ATTRIBUTE_VALUE VARCHAR2(4000)
COUNT NUMBER
表25-35 クラスタリング・アルゴリズムのヒストグラム・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション |
|
モデル内のクラスタのID |
|
クラスタのラベルを指定します |
|
属性名を指定します |
|
属性サブ名を指定します |
|
ビンID |
|
量的ビンの下限 |
|
量的ビンの上限 |
|
質的属性値 |
|
ヒストグラム数 |
ルール・ビューDM$VR
model_nameは、クラスタリング・モデルのルール・レベル情報を説明しています。情報は、属性の述語レベルで提供されます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CLUSTER_ID NUMBER
CLUSTER_NAME NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
OPERATOR VARCHAR2(2)
NUMERIC_VALUE NUMBER
ATTRIBUTE_VALUE VARCHAR2(4000)
SUPPORT NUMBER
CONFIDENCE BINARY_DOUBLE
RULE_SUPPORT NUMBER
RULE_CONFIDENCE BINARY_DOUBLE
表25-36 クラスタリング・アルゴリズムのルール・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション |
|
モデル内のクラスタのID |
|
クラスタのラベルを指定します |
|
属性名を指定します |
|
属性サブ名を指定します |
|
属性述語演算子 - 次の値を使用する条件付き演算子: IN、=、<>、<、>、<=および>= |
|
量的ビンの下限 |
|
質的属性値 |
|
属性述語のサポート |
|
属性述語の信頼度 |
|
ルール・レベルのサポート |
|
ルール・レベルの信頼度 |
25.4.11 期待値最大化のモデル・ディテール・ビュー
期待値最大化(EM)のモデル・ディテール・ビューは、クラスタリング・ビューのそれに対するEMのビューにおける差異を説明しています。GET_MODEL_DETAILS_EM
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
次のビューは、クラスタリング・ビューに対する期待値最大化のビューの相違点を示しています。様々なクラスタリング・ビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。
コンポーネント・ビューDM$VO
model_nameは、EMコンポーネントを説明しています。コンポーネント・ビューには、事前確率およびマップ先のクラスタに関する情報が含まれています。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
COMPONENT_ID NUMBER
CLUSTER_ID NUMBER
PRIOR_PROBABILITY BINARY_DOUBLE
表25-37 コンポーネント・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
コンポーネントの一意の識別子 |
|
モデル内のクラスタのID |
|
コンポーネント事前確率 |
平均および分散コンポーネント・ビューDM$VM
model_nameは、ガウス分布モデル別の属性の平均および分散パラメータに関する情報を提供します。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
COMPONENT_ID NUMBER
ATTRIBUTE_NAME VARCHAR2(4000)
MEAN BINARY_DOUBLE
VARIANCE BINARY_DOUBLE
頻度コンポーネント・ビューDM$VF
model_nameは、EMモデルによって使用される複数値ベルヌーイ分布のパラメータに関する情報を提供します。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
COMPONENT_ID NUMBER
ATTRIBUTE_NAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
FREQUENCY BINARY_DOUBLE
表25-38 頻度コンポーネント・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
コンポーネントの一意の識別子 |
|
列名 |
|
質的属性値 |
|
|
2次元列の場合、EMは属性評価の属性ランク付けと類似したものを提供します。このランク付けは、列のペアに対して計算されたカルバック・ライブラー・ダイバージェンスにわたる、ランクで重み付けされた平均に基づきます。この監視なし属性評価は、DM$VI
model_nameビューに表示され、次のスキーマを含みます。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_IMPORTANCE_VALUE BINARY_DOUBLE
ATTRIBUTE_RANK NUMBER
表25-39 期待値最大化の2次元属性ランク付け
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
列名 |
|
評価の値 |
|
評価の値に基づく属性ランク |
pairwise
カルバック・ライブラー・ダイバージェンスは、DM$VB
model_nameビューにレポートされます。このメトリックは、観察対象の2つの属性の結合分布が、独立性の仮定の下に、予想される分布とどの程度異なっているかを評価します。つまり、値が大きいほど、2つの属性がより依存していることになります。独立性の値は、各ペアワイズ計算に使用されるグリッドのサイズに基づいてスケーリングされます。このため、[0; 1]範囲内の全ての値が比較可能になります。このビューには次のスキーマが含まれます。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
ATTRIBUTE_NAME_1 VARCHAR2(128)
ATTRIBUTE_NAME_2 VARCHAR2(128)
DEPENDENCY BINARY_DOUBLE
表25-40 期待値最大化のカルバック・ライブラー・ダイバージェンス
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
属性1の名前 |
|
属性2の名前 |
|
スケーリングされたペアワイズ・カルバック・ライブラー・ダイバージェンス |
予測表DM$VP
model_nameは、ネストした列をより下の次元空間にマップするために、ランダム予測によって使用される係数を示します。このビューには、作成データ内にネストしたデータまたはテキスト・データが存在する場合のみ行が含まれます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
FEATURE_NAME VARCHAR2(4000)
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
COEFFICIENT NUMBER
表25-41 期待値の最大化の予測表
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
特徴の名前 |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
質的属性値 |
|
予測係数。データ表現はまばらなため、ゼロ以外の係数のみが戻されます。 |
期待値の最大化のグローバルな詳細
次の表は、期待値の最大化のグローバルな詳細について説明しています。
表25-42 期待値の最大化のグローバルな詳細
名前 | 説明 |
---|---|
|
モデル作成プロセスが指定された許容値に収束したかどうかを示します。可能な値は次のとおりです:
|
|
作成データの対数尤度 |
|
モデルで生成されるコンポーネントの数 |
|
モデルで生成されるクラスタの数 |
|
作成で使用される行の数 |
|
モデル作成で使用される乱数シード値 |
|
モデルから除外する空のコンポーネントの数 |
25.4.12 k-Meansのモデル・ディテール・ビュー
k-Means (KM)のモデル・ディテール・ビューは、クラスタの説明ビューおよびスコアリング・ビューを説明しています。GET_MODEL_DETAILS_KM
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
この項では、クラスタリング・ビューに対するk-Meansのビュー内の相違点を説明しています。様々なビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。k-Meansの場合、クラスタの説明ビューDM$VD
model_nameには、追加の列があります。
Name Type
---------------------------------- ----------------------------
DISPERSION BINARY_DOUBLE
表25-43 k-Meansのクラスタの説明
列名 | 説明 |
---|---|
|
標準の統計モデルと比較して、一連の確認された出現が分散しているかどうかを定量化するために使用されるメジャー。 |
スコアリング・ビューDM$VC
model_nameは、各リーフ・クラスタの重心を説明しています。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CLUSTER_ID NUMBER
CLUSTER_NAME NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
VALUE BINARY_DOUBLE
表25-44 k-Meansのスコアリング・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
モデル内のクラスタのID |
|
クラスタのラベルを指定します |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
質的属性値 |
|
重心の値を指定します |
表25-45 モデル・グローバル・ビューのk–Means統計情報
名前 | 説明 |
---|---|
|
モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。
|
|
作成で使用される行の数 |
|
標準が0のために削除された行の数。このことは、コサイン距離を使用するモデルにのみ適用されます。 |
25.4.13 O-Clusterのモデル・ディテール・ビュー
O-Clusterのモデル・ディテール・ビューは、統計ビューを説明しています。GET_MODEL_DETAILS_OC
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
次は、クラスタリング・ビューに対するO-Clusterのビューの相違点を示しています。様々なクラスタリング・ビューの概要は、「クラスタリング・アルゴリズムのモデル・ディテール・ビュー」を参照してください。OCアルゴリズムでは、期待値最大化(EM)およびk-Means (KM)と同じ記述統計ビューが使用されます。次に統計ビューを示します。
-
クラスタ説明
DM$VD
model_name -
属性統計
DM$VA
model_name -
ルール統計
DM$VR
model_name -
ヒストグラム統計
DM$VH
model_name
クラスタ説明ビューDM$VD
model_nameは、O-Clusterコンポーネントを説明しています。クラスタ説明ビューには、分岐述語を示す追加フィールドがあります。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
OPERATOR VARCHAR2(2)
VALUE SYS.XMLTYPE
表25-46 説明ビュー
列名 | 説明 |
---|---|
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
分岐演算子 |
|
分岐値のリスト |
SYS.XMLTYPE
の構造は、次のとおりです。<Element>splitval1</Element>
OCアルゴリズムでは、ヒストグラム・ビューDM$VH
model_nameが、EMおよびk-Means (KM)とは異なるスキーマとともに使用されます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITON_NAME VARCHAR2(128)
CLUSTER_ID NUMBER
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
BIN_ID NUMBER
LABEL VARCHAR2(4000)
COUNT NUMBER
表25-47 ヒストグラム・コンポーネント・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
コンポーネントの一意の識別子 |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
一意の識別子 |
|
ビン・ラベル |
|
ビン・ヒストグラム数 |
表25-48 モデル・グローバル・ビューのO-Cluster統計情報
名前 | 説明 |
---|---|
|
ビルドで使用される合計行数 |
25.4.14 明示的セマンティック分析のモデル・ディテール・ビュー
明示的セマンティック分析(ESA)のモデル・ディテール・ビューは、属性統計ビューおよび特徴ビューを説明しています。モデル・ディテール・ビューを利用することをお薦めします。
ESAアルゴリズムには、次の記述統計ビューがあります。
-
属性統計
DM$VA
model_name -
特徴
DM$VF
model_name
ビューDM$VA
model_nameには、次のスキーマがあります。
PARTITION_NAME VARCHAR2(128)
FEATURE_ID NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
COEFFICIENT BINARY_DOUBLE
表25-49 明示的セマンティック分析の属性ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
トレーニング・データに表示される特徴の一意の識別子 |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
質的属性値 |
|
特徴に関する属性の重みのメジャー |
ビューDM$VF
model_nameには、1つのビュー内のすべての特徴に対して一意の行があります。この特徴は、モデルが事前作成されていて、ソース・トレーニング・データが使用不可の場合に役立ちます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
FEATURE_ID NUMBER/VARCHAR2
表25-50 明示的セマンティック分析の特徴ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
トレーニング・データに表示される特徴の一意の識別子 |
表25-51 モデル・グローバル・ビューの明示的セマンティック分析統計情報
名前 | 説明 |
---|---|
|
入力行の合計数 |
|
フィルタによって削除された行の数 |
25.4.15 Non-Negative Matrix Factorizationのモデル・ディテール・ビュー
Non-Negative Matrix Factorization (NMF)のモデル・ディテール・ビューは、エンコーディングHマトリックス・ビューおよびH逆マトリックス・ビューを説明しています。GET_MODEL_DETAILS_NMF
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
NMFアルゴリズムには、2つのマトリックス・コンテンツ・ビューがあります。
-
エンコーディング(H)マトリックス
DM$VE
model_name -
H逆マトリックス
DM$VI
model_name
ビューDM$VE
model_nameは、NMFモデルのエンコーディング(H)マトリックスを説明しています。FEATURE_NAME
列の型は、NUMBER
またはVARCHAR2
のいずれかです。このビューには次のスキーマ定義が含まれます。
Name Type
------------------- --------------------------
PARTITION_NAME VARCHAR2(128)
FEATURE_ID NUMBER
FEATURE_NAME NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
COEFFICIENT BINARY_DOUBLE
表25-52 Non-Negative Matrix FactorizationのエンコーディングHマトリックス・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
モデル内の特徴のID |
|
モデル内の特徴の名前 |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
属性の値を指定します |
|
特徴への寄与率を表す属性エンコーディング |
ビューDM$VI
model_viewは、NMFモデルの逆Hマトリックスを説明しています。FEATURE_NAME
列の型は、NUMBER
またはVARCHAR2
のいずれかです。このビューには次のスキーマが含まれます。
Name Type
----------------- ------------------------
PARTITION_NAME VARCHAR2(128)
FEATURE_ID NUMBER
FEATURE_NAME NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
COEFFICIENT BINARY_DOUBLE
表25-53 Non-Negative Matrix Factorizationの逆Hマトリックス・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
モデル内の特徴のID |
|
モデル内の特徴の名前 |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
属性の値を指定します |
|
特徴への寄与率を表す属性エンコーディング |
表25-54 モデル・グローバル・ビューのNon-Negative Matrix Factorization統計情報
名前 | 説明 |
---|---|
|
収束エラー |
|
モデル作成プロセスが指定された許容値に収束したかどうかを示します。次は、返される値です。
|
|
作成中の反復回数 |
|
ビルド入力データセットで使用される行の数 |
|
ビルドで使用される行の数 |
25.4.16 特異値分解のモデル・ディテール・ビュー
特異値分解(SVD)のモデル・ディテール・ビューは、Sマトリックス・ビュー、右特異ベクター・ビューおよび左特異ベクター・ビューを説明しています。GET_MODEL_DETAILS_SVD
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
DM$VE
model_nameは、SVDモデル内の各特異値には、関連付けられている主成分分析(PCA)モデル内に対応する主成分があるという事実を利用して、両方のモデル・クラスの共通情報セットを関連付けます。SVDモデルの場合、Sマトリックスのコンテンツを説明します。PCAスコアリングが作成設定として選択されている場合、対応する主成分の分散値および累積分散率も表示されます。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
FEATURE_ID NUMBER
FEATURE_NAME NUMBER/VARCHAR2
VALUE BINARY_DOUBLE
VARIANCE BINARY_DOUBLE
PCT_CUM_VARIANCE BINARY_DOUBLE
表25-55 Sマトリックス・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
モデル内の特徴のID |
|
モデル内の特徴の名前 |
|
マトリックスの入力値 |
|
コンポーネントに記述された分散値。この列は、 この列は、手動で、または |
|
コンポーネントに記述された分散の累積率。コンポーネントは、記述した分散値に従って降順でランク付けされます。 この列は、 この列は、手動で、または |
SVD DM$VV
model_viewは、SVDモデルの右特異ベクターを説明しています。PCAモデルの場合、主成分(固有ベクター)を説明しています。このビューには次のスキーマが含まれます。
Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
FEATURE_ID NUMBER
FEATURE_NAME NUMBER/VARCHAR2
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_VALUE VARCHAR2(4000)
VALUE BINARY_DOUBLE
表25-56 特異値分解の右特異ベクター
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
モデル内の特徴のID |
|
モデル内の特徴の名前 |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
質的属性値。量的属性の場合、 |
|
マトリックスの入力値 |
DM$VU
model_nameは、SVDモデルの左特異ベクターを説明しています。PCAモデルの場合、主成分内のデータの予測を説明しています。このビューは、設定dbms_data_mining.svds_u_matrix_output
がdbms_data_mining.svds_u_matrix_enable
に設定されていない場合、存在しません。このビューには次のスキーマが含まれます。Name Type
---------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
CASE_ID NUMBER/VARHCAR2
FEATURE_ID NUMBER
FEATURE_NAME NUMBER/VARCHAR2
VALUE BINARY_DOUBLE
表25-57 特異値分解の左特異ベクターまたは主成分内の予測データ
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
U マトリックス予測によって記述される作成データ内にある、一意の行識別子。 |
|
モデル内の特徴のID |
|
モデル内の特徴の名前 |
|
マトリックスの入力値 |
特異値分解のグローバルな詳細
次の表は、特異値分解のグローバルな詳細について説明しています。
表25-58 特異値分解のグローバルな詳細
名前 | 説明 |
---|---|
|
モデルで生成される特徴(コンポーネント)の数 |
|
ビルドで使用される合計行数 |
|
モデルの分散値のほとんどが、計算された上位何個の特徴で取得されているかを示す推奨カットオフ。このカットオフ値よりも少ない数の特徴を使用することが、次元削減における有効な方策です。 |
25.4.17 最小記述長のモデル・ディテール・ビュー
最小記述長(属性評価の計算用)のモデル・ディテール・ビューは、属性評価ビューを説明しています。GET_MODEL_DETAILS_AI
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
属性評価ビューDM$VA
model_nameは、属性評価および属性評価ランクについて説明しています。このビューには次のスキーマが含まれます。
Name Type
----------------------------------------- ----------------------------
PARTITION_NAME VARCHAR2(128)
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
ATTRIBUTE_IMPORTANCE_VALUE BINARY_DOUBLE
ATTRIBUTE_RANK NUMBER
表25-59 最小記述長の属性評価ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
評価の値 |
|
評価に基づくランク |
表25-60 モデル・グローバル・ビューの最小記述長統計情報
名前 | 説明 |
---|---|
|
ビルドで使用される合計行数 |
25.4.18 ビニングのモデル・ディテール・ビュー
ビニング・ビューDM$VB
は、自動データ準備で使用されるビン境界を説明しています。
このビューには次のスキーマが含まれます。
Name Type
-------------------- --------------------
PARTITION_NAME VARCHAR2(128)
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
BIN_ID NUMBER
LOWER_BIN_BOUNDARY BINARY_DOUBLE
UPPER_BIN_BOUNDARY BINARY_DOUBLE
ATTRIBUTE_VALUE VARCHAR2(4000)
表25-61 ビニングのモデル・ディテール・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
属性名を指定します |
|
属性サブ名を指定します |
|
ビンID (またはビン識別子) |
|
量的ビンの下限 |
|
量的ビンの上限 |
|
質的値 |
25.4.19 グローバル情報のモデル・ディテール・ビュー
グローバル情報のモデル・ディテール・ビューは、グローバル統計ビュー、アラート・ビューおよび計算済設定ビューを説明しています。GET_MODEL_DETAILS_GLOBAL
ファンクションのかわりにモデル・ディテール・ビューを利用することをお薦めします。
グローバル統計ビューDM$VG
model_nameは、モデル作成に関連するグローバル統計について説明しています。例として、作成に使用される行数、コンバージェンス・ステータスおよびモデルの質メトリックがあります。このビューには次のスキーマが含まれます。
Name Type
------------------- --------------------
PARTITION_NAME VARCHAR2(128)
NAME VARCHAR2(30)
NUMERIC_VALUE NUMBER
STRING_VALUE VARCHAR2(4000)
表25-62 グローバル統計ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
統計の名前 |
|
統計の量的値 |
|
統計の質的値 |
アラート・ビューDM$VW
model_nameは、モデルの作成中に発行されたアラートをリストします。このビューには次のスキーマが含まれます。
Name Type
------------------- ----------------------
PARTITION_NAME VARCHAR2(128)
ERROR_NUMBER BINARY_DOUBLE
ERROR_TEXT VARCHAR2(4000)
表25-63 アラート・ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
エラー番号(イベントがエラーのとき有効) |
|
エラー・メッセージ |
計算済設定ビューDM$VS
model_nameは、アルゴリズムの計算済設定を示します。このビューには次のスキーマが含まれます。
Name Type
----------------- --------------------
PARTITION_NAME VARCHAR2(128)
SETTING_NAME VARCHAR2(30)
SETTING_VALUE VARCHAR2(4000)
表25-64 計算済設定ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション名 |
|
設定の名前 |
|
設定の値 |
25.4.20 正規化および欠損値の処理のモデル・ディテール・ビュー
正規化および欠損値の処理ビューDM$VN
は、自動データ準備(ADP)で使用される正規化パラメータ、およびNULL
値が発生したときの欠損値の置換を説明しています。欠損値の置換は、2次元の列にのみ適用され、ネストされた列には適用されません。
このビューには次のスキーマが含まれます。
Name Type
---------------------- -----------------------
PARTITION_NAME VARCHAR2(128)
ATTRIBUTE_NAME VARCHAR2(128)
ATTRIBUTE_SUBNAME VARCHAR2(4000)
NUMERIC_MISSING_VALUE BINARY_DOUBLE
CATEGORICAL_MISSING_VALUE VARCHAR2(4000)
NORMALIZATION_SHIFT BINARY_DOUBLE
NORMALIZATION_SCALE BINARY_DOUBLE
表25-65 正規化および欠損値の処理ビュー
列名 | 説明 |
---|---|
|
パーティション化されたモデルのパーティション |
|
列名 |
|
ネストした列のサブ名。この値は、ネストされていない列に対してはNULLです。 |
|
量的欠損値の置換 |
|
質的欠損値の置換 |
|
正規化シフト値 |
|
正規化スケール値 |