38 DBMS_DATA_MINING

Oracle Data Miningは、データから実用的な情報を抽出する分析技術です。Oracle Data Miningを使用すると、今後イベントが発生する確率を評価したり、データ内の予期しない相関およびグループを検出できます。

DBMS_DATA_MININGパッケージは、Oracle Data Miningへの主要なインタフェースとなります。 PL/SQL API上にJava APIがあります。Oracle Data Miningでは、データ・マイニング・モデルをデプロイするためのSQLファンクション・ファミリもサポートされています。

Oracle Data MinerはOracle Data Miningのグラフィカル・インタフェースで、OTN-J（Oracle Technology Network Japan）からダウンロードして入手できます。 http://www.oracle.com/technology/products/bi/odm/index.htmlにアクセスしてください。

関連項目:

第39章「DBMS_DATA_MINING_TRANSFORM」。このパッケージは、データ・マイニング・モデル用のデータの前処理をサポートしています。
第89章「DBMS_PREDICTIVE_ANALYTICS」。このパッケージは、自動データ・マイニングを実行するいくつかのルーチンをサポートしています。
SQLデータ・マイニング・ファンクションの詳細は、『Oracle Database SQL言語リファレンス』を参照してください。
Oracle Data Miningの概要は、『Oracle Data Mining概要』を参照してください。
11gリリース1（11.1）の新機能の詳細は、『Oracle Data Mining概要』を参照してください。

この章では、次の項目について説明します。

DBMS_DATA_MININGの使用方法
DBMS_DATA_MININGサブプログラムの要約

DBMS_DATA_MININGの使用方法

この項では、DBMS_DATA_MININGパッケージの使用に関連する項目について説明します。

概要
マイニング・モデルのオブジェクト
推奨されないサブプログラム
マイニング機能
モデル設定
データ型

概要

Oracle Data Miningでは、監視ありデータ・マイニングと監視なしデータ・マイニングの両方がサポートされています。監視ありデータ・マイニングでは、履歴データに基づいてターゲット値が予測されます。監視なしデータ・マイニングでは、自然なグループが検出され、ターゲットは使用されません。

関連項目:

監視ありデータ・マイニングと監視なしデータ・マイニングに関する基本的な情報およびデータ・マイニングの機能とアルゴリズムの詳細は、『Oracle Data Mining概要』を参照してください。

データ・マイニング機能は、データ・マイニングに関する特定の種類の問題を解決するための方法です。マイニング機能は、モデルの作成時に指定する必要があります。詳細は、「マイニング機能」を参照してください。

用語に関する注意:

データ・マイニングにおいては、機能とは、データ・マイニングへの特定のアプローチによって解決される一般的な種類の問題のことです。 SQL言語においては、ファンクションとは、値を戻す演算子のことを示します。

Oracle Data Miningドキュメントでは、機能およびマイニング機能とはデータ・マイニング機能を示し、SQLファンクションまたはSQLデータ・マイニング・ファンクションとは、データ・マイニング・モデルをスコアリング（デプロイ）するSQLファンクションを示します。 SQLデータ・マイニング・ファンクションの詳細は、『Oracle Database SQL言語リファレンス』を参照してください。

監視ありデータ・マイニングには、次の機能があります。

分類
回帰
属性評価

監視なしデータ・マイニングには、次の機能があります。

クラスタリング
相関
特徴抽出
異常検出（1クラス分類）

マイニング・モデルを作成して適用する手順は、使用するデータ・マイニング機能およびアルゴリズムによって異なります。表38-1に、Oracle Data Miningでサポートされているアルゴリズムを示します。

表38-1 Oracle Data Miningのアルゴリズム

アルゴリズム	略称	機能
Adaptive Bayes Network（非推奨）	ABN	分類
Apriori	AP	相関
ディシジョン・ツリー	DT	分類
一般化線形モデル	GLM	分類と回帰
k-Means（デフォルトのクラスタリング・アルゴリズム）	KM	クラスタリング
最小記述長	MDL	属性評価
Naive Bayes（デフォルトの分類アルゴリズム）	NB	分類
Non-Negative Matrix Factorization	NMF	特徴抽出
直交パーティショニング・クラスタリング	O-Cluster	クラスタリング
サポート・ベクター・マシン（デフォルトの回帰アルゴリズム）	SVM	分類と回帰（および1クラス分類を使用した異常検出）

マイニング・モデルのオブジェクト

マイニング・モデルは、Oracle Databaseのスキーマ・オブジェクトです。マイニング・モデルでは、Oracle Databaseの標準セキュリティ機能がサポートされています。また、SQL COMMENTおよびSQL AUDITもサポートされています。

関連項目:

マイニング・モデルのオブジェクト、SQL COMMENTおよびSQL AUDITの詳細は、『Oracle Data Mining管理者ガイド』を参照してください。
マイニング・モデルのセキュリティの詳細は、『Oracle Data Mining管理者ガイド』を参照してください。
データ・マイニングのサンプル・プログラムについては、『Oracle Data Mining管理者ガイド』を参照してください。

ALL_MINING_MODELS

データ・ディクショナリ・ビューALL_MINING_MODELSを問い合せると、アクセス可能なマイニング・モデルのリストを取得できます。

例38-1 ALL_MINING_MODELS

SQL> describe all_mining_models
 Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 OWNER                                     NOT NULL VARCHAR2(30)
 MODEL_NAME                                NOT NULL VARCHAR2(30)
 MINING_FUNCTION                                    VARCHAR2(30)
 ALGORITHM                                          VARCHAR2(30)
 CREATION_DATE                             NOT NULL DATE
 BUILD_DURATION                                     NUMBER
 MODEL_SIZE                                         NUMBER
 COMMENTS                                           VARCHAR2(4000)

関連項目:

ALL_MINING_MODELSおよび関連ビューの詳細は、『Oracle Data Miningアプリケーション開発者ガイド』を参照してください。

マイニング・モデルのネーミングにおける制限

モデルのネーミング規則には、大部分のデータベース・スキーマ・オブジェクトのネーミング規則よりも多くの制限があります。モデル名は、次の要件も満たす必要があります。

名前の長さは、25文字までにする必要があります。
名前は、引用符で囲まれていない識別子である必要があります。引用符で囲まれていない識別子は、英数字、アンダースコア（_）、ドル記号（$）および番号記号（#）のみで構成され、最初の文字はアルファベットである必要があります。引用符で囲まれていないリテラルに、ドル記号および番号記号は使用しないことを強くお薦めします。

スキーマ・オブジェクトのネーミング要件の詳細は、『Oracle Database SQL言語リファレンス』を参照してください。

ALL_MINING_MODEL_ATTRIBUTES

データ・ディクショナリ・ビューALL_MINING_MODEL_ATTRIBUTESを問い合せると、アクセス可能なマイニング・モデルごとにデータ属性のリストを取得できます。データ属性は、モデルの作成にアルゴリズムが使用するデータの列です。モデルを適用するデータに、これらの列の一部またはすべてが存在している必要があります。

データ属性は、モデルのシグネチャと呼ばれます。監視ありモデルの場合、ALL_MINING_MODEL_ATTRIBUTESビューでは、ターゲットのデータ属性を含め、モデルのシグネチャのデータ属性が表示されます。

アルゴリズムによって、データ属性の内部表記が作成され、質的（分類またはカテゴリ化されたデータ）または量的（連続データ）のいずれかとして使用されます。これらの内部のモデル属性を表示するには、GET_MODEL_DETAILSファンクションを使用します。

例38-2 ALL_MINING_MODEL_ATTRIBUTES

SQL> describe all_mining_model_attributes
 Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 OWNER                                     NOT NULL VARCHAR2(30)
 MODEL_NAME                                NOT NULL VARCHAR2(30)
 ATTRIBUTE_NAME                            NOT NULL VARCHAR2(30)
 ATTRIBUTE_TYPE                                     VARCHAR2(11)
 DATA_TYPE                                          VARCHAR2(12)
 DATA_LENGTH                                        NUMBER
 DATA_PRECISION                                     NUMBER
 DATA_SCALE                                         NUMBER
 USAGE_TYPE                                         VARCHAR2(8)
 TARGET                                             VARCHAR2(3)

関連項目:

属性およびALL_MINING_MODEL_ATTRIBUTESの詳細は、『Oracle Data Miningアプリケーション開発者ガイド』を参照してください。

ALL_MINING_MODEL_SETTINGS

ALL_MINING_MODEL_SETTINGSビューでは、アクセス可能なマイニング・モデルごとの設定が戻されます。設定では、マイニング・モデルの様々な特性が制御されます。

すべての設定にはデフォルト値があります。一部の設定は、デフォルトでアルゴリズムによって生成されます。モデルの設定表に値を指定すると、デフォルトの設定値を上書きできます。 ALL_MINING_MODEL_SETTINGSでは、すべての設定（デフォルトとユーザー指定の両方）が表示されます。

例38-3 ALL_MINING_MODEL_SETTINGS

SQL> describe all_mining_model_settings
 Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 OWNER                                     NOT NULL VARCHAR2(30)
 MODEL_NAME                                NOT NULL VARCHAR2(30)
 SETTING_NAME                              NOT NULL VARCHAR2(30)
 SETTING_VALUE                                      VARCHAR2(4000)
 SETTING_TYPE                                       VARCHAR2(7)

関連項目:

「モデル設定」
ALL_MINING_MODEL_SETTINGSの詳細は、『Oracle Data Miningアプリケーション開発者ガイド』を参照してください。

推奨されないサブプログラム

11gリリース1（11.1）では、次のサブプログラムの使用は非推奨になっています。

GET_DEFAULT_SETTINGS

データ・ディクショナリ・ビューUSER/ALL/DBA_MINING_MODEL_SETTINGSと置き換えられています。
GET_MODEL_SETTINGS

データ・ディクショナリ・ビューUSER/ALL/DBA_MINING_MODEL_SETTINGSと置き換えられています。
GET_MODEL_SIGNATURE

データ・ディクショナリ・ビューUSER/ALL/DBA_MINING_MODEL_ATTRIBUTESと置き換えられています。

11gリリース1（11.1）では、次のビューの使用は非推奨になっています。

DM_USER_MODELS

データ・ディクショナリ・ビューUSER/ALL/DBA_MINING_MODELSと置き換えられています。

11gリリース1（11.1）では、Adaptive Bayes Networkアルゴリズムの使用は非推奨になっています。

注意:

新しいアプリケーションでは、これらのプロシージャを使用しないことをお薦めします。これらのプロシージャは、下位互換性を維持する目的のみでサポートされています。

11gリリース1（11.1）では、DMSYSスキーマは使用されなくなりました。Oracle Data Miningメタデータは、SYS内にあります。

マイニング機能

表38-2に、モデルのマイニング機能を指定する定数を示します。マイニング機能の概要は、「概要」を参照してください。

すべてのモデルは、マイニング機能を使用して作成されます。マイニング機能は、CREATE_MODELプロシージャの必須引数です。

表38-2 マイニング機能

値	説明
`ASSOCIATION`	相関は、記述マイニング機能の一種です。相関モデルによって、データ・セット内に存在する関係とその発生確率が識別されます。相関モデルでは、Aprioriアルゴリズムが使用されます。
`ATTRIBUTE_IMPORTANCE`	属性評価は、予測マイニング機能の一種です。属性評価モデルによって、特定の結果を予測する際の、属性の相対的な重要度が識別されます。属性評価モデルでは、最小記述長アルゴリズムが使用されます。
`CLASSIFICATION`	分類は、予測マイニング機能の一種です。分類モデルでは、履歴データを使用して、質的ターゲットが予測されます。分類モデルでは、Naive Bayes、Adaptive Bayes Network（非推奨）、ディシジョン・ツリー、ロジスティック回帰またはサポート・ベクター・マシンの各アルゴリズムを使用できます。デフォルトはNaive Bayesです。分類機能は、異常検出にも使用できます。この場合は、NULLターゲットを含むSVMアルゴリズムが使用されます（1クラスSVM）。
`CLUSTERING`	クラスタリングは、記述マイニング機能の一種です。クラスタリング・モデルによって、データ・セット内の自然なグループが識別されます。クラスタリング・モデルでは、k-MeansまたはO-Clusterアルゴリズムが使用されます。デフォルトはk-Meansです。
`FEATURE_EXTRACTION`	特徴抽出は、記述マイニング機能の一種です。特徴抽出モデルによって、モデルのベースとなる最適なデータ・セットが作成されます。特徴抽出モデルでは、Non-negative Matrix Factorizationアルゴリズムが使用されます。
`REGRESSION`	回帰は、予測マイニング機能の一種です。回帰モデルでは、履歴データを使用して、量的ターゲットが予測されます。回帰モデルでは、サポート・ベクター・マシンまたは線形回帰を使用できます。デフォルトはサポート・ベクター・マシンです。

モデル設定

Oracle Data Miningは、設定を使用してアルゴリズムおよびモデルに関するその他の特性を指定します。設定には、一般的な設定と、マイニング機能およびアルゴリズムに固有の設定があります。

すべての設定にはデフォルト値があります。モデルの1つ以上の設定を上書きするには、設定表を作成する必要があります。設定表には、表38-3で示す列名およびデータ型を含める必要があります。

表38-3 モデル設定表に必要な列

列名	データ型
`SETTING_NAME`	`VARCHAR2(30)`
`SETTING_VALUE`	`VARCHAR2(4000)`

設定表に指定する情報は、モデルの作成時に使用されます。設定表の名前は、CREATE_MODELプロシージャのオプションの引数です。

データ・ディクショナリ・ビューALL_MINING_MODEL_SETTINGSを問い合せると、モデルで使用される設定を検索できます。このビューでは、アクセス権限を持つマイニング・モデルで使用されるモデル設定が表示されます。デフォルトまたはユーザー指定かに関係なく、ビューにはすべての設定値が含まれます。「ALL_MINING_MODEL_SETTINGS」を参照してください。

アルゴリズム名

ALGO_NAME設定では、モデルのアルゴリズムが指定されます。表38-4に、ALGO_NAME設定の値を示します。

表38-4 アルゴリズム名

ALGO_NAME値	説明	マイニング機能
`ALGO_ADAPTIVE_BAYES_NETWORK`	Adaptive Bayes Network（非推奨）	分類
`ALGO_DECISION_TREE`	ディシジョン・ツリー	分類
`ALGO_NAIVE_BAYES`	Naive Bayes	分類
`ALGO_GENERALIZED_LINEAR_MODEL`	一般化線形モデル	分類と回帰
`ALGO_SUPPORT_VECTOR_MACHINES`	サポート・ベクター・マシン	分類と回帰
`ALGO_KMEANS`	拡張k_Means	クラスタリング
`ALGO_O_CLUSTER`	O-Cluster	クラスタリング
`ALGO_AI_MDL`	最小記述長	属性評価
`ALGO_APRIORI_ASSOCIATION_RULES`	Apriori	相関ルール
`ALGO_NONNEGATIVE_MATRIX_FACTOR`	Non-Negative Matrix Factorization	特徴抽出

Oracle Data Miningでは、分類、回帰およびクラスタリングのマイニング機能に対して2つ以上のアルゴリズムがサポートされています。これらの各マイニング機能には、表38-5に示されているデフォルト・アルゴリズムがあります。

表38-5 デフォルト・アルゴリズム

マイニング機能	デフォルト・アルゴリズム
分類	Naive Bayes
回帰	サポート・ベクター・マシン
クラスタリング	k-Means

自動データ準備

PREP_AUTO設定は、モデルが自動データ準備（ADP）を使用するかどうかを指定します。デフォルトでは、ADPは無効です。

ADPを有効にすると、モデルでは、経験則を使用し、アルゴリズムの要件に応じて作成データを変換します。変換命令は、モデルに格納され、モデルが適用されるたびに再利用されます。変換命令は、モデルの詳細で表示できます。

モデルの作成時にxform_listパラメータに追加の変換を指定することによって、自動データ準備を補うことができます。（「CREATE_MODELプロシージャ」を参照）

ADPを使用せず（デフォルト）、CREATE_MODELへのxform_listパラメータに変換を指定しない（デフォルト）場合、10.2モードで操作が続行されます。したがって、データの作成、テストおよびスコアリングを行う場合に、個別に独自の変換を実装する必要があります。各データ・セットでまったく同じ変換を実装するように、細心の注意が必要です。

ADPを使用せず、CREATE_MODELへのxform_listパラメータに変換を指定する場合、Oracle Data Miningでは、モデルに変換定義が埋め込まれ、モデル作成データと一致するようにテスト・データおよびスコアリング・データが準備されます。データ準備が自動的であり、埋め込まれているため、マイニング・モデルは、スーパーモデルとも呼ばれます。

表38-6に、PREP_AUTO設定の値を示します。

表38-6 PREP_AUTO設定

PREP_AUTOの値	説明
`PREP_AUTO_OFF`	自動データ準備を無効にします（デフォルト）。
`PREP_AUTO_ON`	自動データ準備を有効にします。

関連項目:

データ準備の詳細は、『Oracle Data Mining概要』を参照してください。

マイニング機能の設定

表38-7に示されている設定がマイニング機能に適用されます。

表38-7 マイニング機能の設定

マイニング機能	設定名	設定値	説明
相関	`ASSO_MAX_RULE_LENGTH`	`TO_CHAR( 2<=` `numeric_expr` `<=20)`	相関ルールの最大ルール長。デフォルトは4です。
相関	`ASSO_MIN_CONFIDENCE`	`TO_CHAR( 0<=` `numeric_expr` `<=1)`	相関ルールの最小信頼度。デフォルトは0.1です。
相関	`ASSO_MIN_SUPPORT`	`TO_CHAR( 0<=` `numeric_expr` `<=1)`	相関ルールの最小支持度。デフォルトは0.1です。
分類	`CLAS_COST_TABLE_NAME`	table_name	（ディシジョン・ツリーのみ）モデル作成のアルゴリズムに使用されるコスト・マトリックスを格納する表の名前。コスト・マトリックスは、分類ミスに関連するコストを指定します。作成時には、ディシジョン・ツリー・モデルのみがコスト・マトリックスを使用できます。適用時には、すべての分類アルゴリズムがコスト・マトリックスを使用できます。コスト・マトリックス表は、ユーザーが作成します。列の要件については、「ADD_COST_MATRIXプロシージャ」を参照してください。コストの詳細は、『Oracle Data Mining概要』を参照してください。
分類	`CLAS_PRIORS_TABLE_NAME`	table_name	（Naive Bayes）作成データとスコアリング・データの分布の差を埋めるために、事前確率を格納する表の名前。事前確率表は、ユーザーが作成します。列の要件については、『Oracle Data Miningアプリケーション開発者ガイド』を参照してください。事前確率の詳細は、『Oracle Data Mining概要』を参照してください。 SVM分類は、クラスの重みについては事前確率表を使用します。
分類	`CLAS_WEIGHTS_TABLE_NAME`	table_name	（GLMのみ）ロジスティック回帰モデルの各ターゲット値に関する重み情報を格納する表の名前。アルゴリズムでは、重みを使用して、より高い重み付けのクラスを優先するようにモデルにバイアスをかけます。クラスの重み表は、ユーザーが作成します。列の要件については、『Oracle Data Miningアプリケーション開発者ガイド』を参照してください。ロジスティック回帰のクラスの重みの詳細は、『Oracle Data Mining概要』を参照してください。
クラスタリング	`CLUS_NUM_CLUSTERS`	`TO_CHAR( numeric_expr` `>=1)`	クラスタリング・アルゴリズムで生成されるクラスタの数。デフォルトは10です。
特徴抽出	`FEAT_NUM_FEATURES`	`TO_CHAR(numeric_expr` `>=1)`	特徴抽出モデルで抽出される特徴の数。アルゴリズムによって、データからデフォルトが見積もられます。

関連項目:

マイニング機能の詳細は、『Oracle Data Mining概要』を参照してください。

グローバルな設定

表38-8の設定はあらゆるタイプのモデルに適用できますが、現在はGLMに対してのみ実装されています。

データ・ディクショナリ・ビュー*_MINING_MODEL_SETTINGS（接頭辞ALL、USERまたはDBAを使用）を問い合せると、モデルの設定値を確認できます。 *_MINING_MODEL_SETTINGSについては、『Oracle Data Miningアプリケーション開発者ガイド』を参照してください。

表38-8 グローバルな設定

設定名設定値説明

設定名	設定値	説明
`ODMS_MISSING_VALUE_TREATMENT`	`ODMS_MISSING_VALUE_MEAN_MODE` `ODMS_MISSING_VALUE_DELETE_ROW`	（GLMのみ）トレーニング・データでの欠損値を処理する方法。この設定は、スコアリング・データに影響を与えません。 Oracle Data Miningでは、欠損値は、作成時と適用時に、平均値（量的属性）または最頻値（質的属性）に置き換えられます。 `ODMS_MISSING_VALUE_TREATMENT`を`ODMS_MISSING_VALUE_DELETE_ROW`に設定すると、トレーニング・データでのこの動作を上書きできます。 `ODMS_MISSING_VALUE_TREATMENT`を`ODMS_MISSING_VALUE_DELETE_ROW`に設定すると、欠損値を含むトレーニング・データの行は削除されます。ただし、スコアリング・データにおいてこのような欠損値の処理を行うには、明示的に変換を実行する必要があります。手順については、『Oracle Data Mining概要』を参照してください。値`ODMS_MISSING_VALUE_DELETE_ROW`は、ネストした列を含まない表でのみ有効です。ネストしたデータでこの値を使用すると、例外が発生します。
`ODMS_ROW_WEIGHT_COLUMN_NAME`	column_name	（GLMのみ）行の重み要素を含むトレーニング・データの列の名前。行の重みは、特定の構成が複数回繰り返される試用を設計する場合のように、繰返し行のコンパクトな表現として使用できます。また、行の重みは、モデルの作成中に特定の行を強調するためにも使用できます。たとえば、より新しい行を優先し、古い可能性のあるデータを避けるようにバイアスをかける場合に使用できます。

ODMS_MISSING_VALUE_TREATMENT

ODMS_MISSING_VALUE_MEAN_MODE

ODMS_MISSING_VALUE_DELETE_ROW

（GLMのみ）トレーニング・データでの欠損値を処理する方法。この設定は、スコアリング・データに影響を与えません。

Oracle Data Miningでは、欠損値は、作成時と適用時に、平均値（量的属性）または最頻値（質的属性）に置き換えられます。 ODMS_MISSING_VALUE_TREATMENTをODMS_MISSING_VALUE_DELETE_ROWに設定すると、トレーニング・データでのこの動作を上書きできます。 ODMS_MISSING_VALUE_TREATMENTをODMS_MISSING_VALUE_DELETE_ROWに設定すると、欠損値を含むトレーニング・データの行は削除されます。ただし、スコアリング・データにおいてこのような欠損値の処理を行うには、明示的に変換を実行する必要があります。手順については、『Oracle Data Mining概要』を参照してください。

値ODMS_MISSING_VALUE_DELETE_ROWは、ネストした列を含まない表でのみ有効です。ネストしたデータでこの値を使用すると、例外が発生します。

ODMS_ROW_WEIGHT_COLUMN_NAME

column_name

（GLMのみ）行の重み要素を含むトレーニング・データの列の名前。

行の重みは、特定の構成が複数回繰り返される試用を設計する場合のように、繰返し行のコンパクトな表現として使用できます。また、行の重みは、モデルの作成中に特定の行を強調するためにも使用できます。たとえば、より新しい行を優先し、古い可能性のあるデータを避けるようにバイアスをかける場合に使用できます。

関連項目:

GLMの詳細は、『Oracle Data Mining概要』を参照してください。

アルゴリズムの設定: Adaptive Bayes Network（非推奨）

これらの設定は、Adaptive Bayes Networkアルゴリズムの動作に影響を与えます。

データ・ディクショナリ・ビュー*_MINING_MODEL_SETTINGS（接頭辞ALL、USERまたはDBAを使用）を問い合せると、モデルの設定値を確認できます。*_ALL_MINING_MODEL_SETTINGSについては、『Oracle Data Miningアプリケーション開発者ガイド』を参照してください。

表38-9 ABNの設定

設定	値	説明
`ABNS_MAX_BUILD_MINUTES`	`TO_CHAR(` `numeric_expr` `>=0)`	ABNモデルの作成を完了するまでの最大時間。デフォルトは0です（時間制限がないことを示します）。
`ABNS_MAX_NB_PREDICTORS`	`TO_CHAR(` `numeric_expr` `>0)`	`abns_naive_bayes`型のABNモデルの作成に必要な予測子の最大数（MDLランキングで測定）。デフォルトは10です。
`ABNS_MAX_PREDICTORS`	`TO_CHAR(numeric_expr` `>0)`	`abns_single_feature`タイプまたは`abns_multi_feature`タイプのABNモデルの作成に必要な予測子の最大数（MDLランキングで測定）。デフォルトは25です。
`ABNS_MODEL_TYPE`	`ABNS_MULTI_FEATURE` `ABNS_NAIVE_BAYES` `ABNS_SINGLE_FEATURE`	ABNモデルのタイプ。デフォルトは`multi_feature`です。

アルゴリズムの設定: ディシジョン・ツリー

これらの設定は、ディシジョン・ツリー・アルゴリズムの動作に影響を与えます。

表38-10 ディシジョン・ツリーの設定

設定	値	説明
`TREE_IMPURITY_METRIC`	`TREE_IMPURITY_ENTROPY` `TREE_IMPURITY_GINI`	ディシジョン・ツリーのツリー不純メトリック。ツリー・アルゴリズムでは、各ノードでのデータの分岐に最適なテスト質問が検索されます。最適な分岐および分岐値は、ノードのエンティティに対するターゲット値の同質性（純度）が最大限に高くなるものです。純度は、メトリックに従って測定します。ディシジョン・ツリーでは、純度メトリックとしてジニ（`TREE_IMPURITY_GINI`）またはエントロピ（`TREE_IMPURITY_ENTROPY`）のいずれかを使用できます。デフォルトではジニが使用されます。
`TREE_TERM_MAX_DEPTH`	`TO_CHAR( 2<=` `numeric_expr` `<=20)`	分岐の条件: ツリーの最大深度（ルート・ノードとリーフ・ノードとの間（リーフ・ノードを含む）の最大ノード数）。デフォルトは7です。
`TREE_TERM_MINPCT_MODE`	`TO_CHAR( 0<=` `numeric_expr` `<=10)`	この数値より小さいレコードを子に含めることはできません。この数値は、トレーニング行の割合で表現されます。デフォルトは0.05で、0.05%を表します。
`TREE_TERM_MINPCT_SPLIT`	`TO_CHAR( 0 <=` `numeric_expr` `<=20)`	分岐の条件: 親ノードのレコードの最小数。この数値は、モデルのトレーニングに使用される総レコード数の割合で表現されます。レコード数がこの値よりも少ない場合、分岐は試行されません。デフォルトは0.1で、0.1%を表します。
`TREE_TERM_MINREC_NODE`	`TO_CHAR(numeric_expr` `>=0)`	この数値より小さいレコードは、子に含めることができません。デフォルトは10です。
`TREE_TERM_MINREC_SPLIT`	`TO_CHAR( numeric_expr` `>=0)`	分岐の条件: 値として表現される親ノードのレコードの最小数。レコード数がこの値よりも少ない場合、分岐は試行されません。デフォルトは20です。

アルゴリズムの設定: 一般化線形モデル

これらの設定は、GLMモデルの動作に影響を与えます。GLMは、分類（ロジスティック回帰）または回帰（線形回帰）で使用できます。

表38-11 GLMの設定

設定名	設定値	説明
`GLMS_CONF_LEVEL`	`TO_CHAR(0<` `numeric_expr` `<1)`	信頼区間の信頼水準。デフォルトの信頼水準は0.95です。
`GLMS_DIAGNOSTICS_TABLE_NAME`	table_name	GLMモデルに関する行レベルの診断情報を含む表の名前。この表は、モデルの作成中に作成されます。診断表を作成する場合は、モデルの作成時にケースIDを指定する必要があります。（「CREATE_MODELプロシージャ」を参照）診断表を指定し、ケースIDを指定しない場合は、例外が発生します。 GLM診断の詳細は、『Oracle Data Mining概要』を参照してください。
`GLMS_REFERENCE_CLASS_NAME`	target_value	ロジスティック回帰モデルで参照値として使用されるターゲット値。その他（非参照）のクラスの場合は、確率が生成されます。デフォルトでは、参照クラスの場合、最も普及率の高い値（ほとんどのケース）がアルゴリズムによって選択されます。
`GLMS_RIDGE_REGRESSION`	`GLMS_RIDGE_REG_ENABLE` `GLMS_RIDGE_REG_DISABLE`	リッジ回帰が有効かどうかの指定。デフォルトでは、リッジを使用するかどうかはアルゴリズムによって決定されます。 `GLMS_RIDGE_REGRESSION`を`GLMS_RIDGE_REG_ENABLE`に設定すると、明示的にリッジを有効にできます。リッジは、回帰と分類の両方のマイニング機能に適用されます。リッジを有効にすると、`PREDICTION_BOUNDS` SQL演算子によって予測限界は生成されません。
`GLMS_RIDGE_VALUE`	`TO_CHAR(0<` `numeric_expr)`	アルゴリズムで使用されるリッジ・パラメータの値。この設定は、`GLMS_RIDGE_REGRESSION`を`GLMS_RIDGE_REG_ENABLE`に設定して明示的にリッジ回帰を有効にした場合にのみ使用されます。リッジ回帰がアルゴリズムによって内部的に有効になっている場合、リッジ・パラメータはアルゴリズムによって決定されます。
`GLMS_VIF_FOR_RIDGE`	`GLMS_VIF_RIDGE_ENABLE` `GLMS_VIF_RIDGE_DISABLE`	（線形回帰のみ）リッジが作成されたときにVariance Inflation Factor（VIF）統計を作成するかどうかの指定。デフォルトでは、リッジを有効にするとVIFは生成されません。 `GLMS_RIDGE_REGRESSION`を`GLMS_RIDGE_REG_ENABLE`に設定して明示的にリッジ回帰を有効にすると、`GLMS_VIF_FOR_RIDGE`を`GLMS_VIF_RIDGE_ENABLE`に設定してVIF統計を要求できます。十分なシステム・リソースを使用できる場合、アルゴリズムによってVIFが作成されます。

関連項目:

GLMの詳細は、『Oracle Data Mining概要』を参照してください。

アルゴリズムの設定: k-Means

これらの設定は、k-Meansアルゴリズムの動作に影響を与えます。

表38-12 k-Meansの設定

設定名	設定値	説明
`KMNS_BLOCK_GROWTH`	`TO_CHAR(1<` `numeric_expr` `<=5)`	クラスタ・データを保持するために割り当てられるメモリーの増加因数。デフォルト値は2です。
`KMNS_CONV_TOLERANCE`	`TO_CHAR(0<` `numeric_expr` `<=0.5)`	k-Meansアルゴリズムの汎用的最適化。デフォルトは0.01です。
`KMNS_DISTANCE`	`KMNS_COSINE` `KMNS_EUCLIDEAN` `KMNS_FAST_COSINE`	k-Meansクラスタリングの距離関数。デフォルトはユークリッドです。
`KMNS_ITERATIONS`	`TO_CHAR(0<` `numeric_expr` `<=20)`	k-Meansアルゴリズムの反復回数。デフォルトは3です。
`KMNS_MIN_PCT_ATTR_SUPPORT`	`TO_CHAR(0<=` `numeric_expr` `<=1)`	クラスタのルール記述にその属性を含めるために必要な、非NULL値でなければならない属性値の割合。欠損値を含むデータでこのパラメータ値の設定が高すぎると、非常に短いルールや空のルールとなる可能性があります。デフォルトは0.1です。
`KMNS_NUM_BINS`	`TO_CHAR(numeric_expr` `>0)`	ヒストグラムのビンの数。k-Meansで生成される属性ヒストグラムでのビンの数を指定します。各属性のビンの境界は、トレーニング・データ・セット全体でグローバルに計算されます。ビニングの方法は等幅です。すべての属性でビンの数は同じです。ただし、単一の値を持つ属性では、ビンは1つのみです。デフォルトは10です。
`KMNS_SPLIT_CRITERION`	`KMNS_SIZE` `KMNS_VARIANCE`	k-Meansクラスタリングの分割基準。デフォルトの基準は`KMNS_VARIANCE`です。

関連項目:

k-Meansの詳細は、『Oracle Data Mining概要』を参照してください。

アルゴリズムの設定: Naive Bayes

これらの設定は、Naive Bayesアルゴリズムの動作に影響を与えます。

表38-13 Naive Bayesの設定

設定名設定値説明

設定名	設定値	説明
`NABS_PAIRWISE_THRESHOLD`	`TO_CHAR(0<=` `numeric_expr` `<=1)`	NBアルゴリズムでの組しきい値。デフォルトは0.01です。
`NABS_SINGLETON_THRESHOLD`	`TO_CHAR(0<=` `numeric_expr` `<=1)`	NBアルゴリズムでの単一しきい値。デフォルトは0.01です。

NABS_PAIRWISE_THRESHOLD

TO_CHAR(0<= numeric_expr <=1)

NBアルゴリズムでの組しきい値。

デフォルトは0.01です。

NABS_SINGLETON_THRESHOLD

TO_CHAR(0<= numeric_expr <=1)

NBアルゴリズムでの単一しきい値。

デフォルトは0.01です。

関連項目:

Naive Bayesの詳細は、『Oracle Data Mining概要』を参照してください。

アルゴリズムの設定: Non-Negative Matrix Factorization

これらの設定は、Non-Negative Matrix Factorizationの動作に影響を与えます。

表38-14 NMFの設定

設定名設定値説明

設定名	設定値	説明
`NMFS_CONV_TOLERANCE`	`TO_CHAR(0<` `numeric_expr` `<=0.5)`	NMFアルゴリズムでの汎用的最適化。デフォルトは0.05です。
`NMFS_NUM_ITERATIONS`	`TO_CHAR(1 <=` `numeric_expr` `<=500)`	NMFアルゴリズムの反復回数。デフォルトは50です。
`NMFS_RANDOM_SEED`	`TO_CHAR(numeric_expr)`	NMFアルゴリズムのランダム・シード。デフォルトは–1です。

NMFS_CONV_TOLERANCE

TO_CHAR(0< numeric_expr <=0.5)

NMFアルゴリズムでの汎用的最適化。

デフォルトは0.05です。

NMFS_NUM_ITERATIONS

TO_CHAR(1 <= numeric_expr <=500)

NMFアルゴリズムの反復回数。

デフォルトは50です。

NMFS_RANDOM_SEED

TO_CHAR(numeric_expr)

NMFアルゴリズムのランダム・シード。

デフォルトは–1です。

関連項目:

NMFの詳細は、『Oracle Data Mining概要』を参照してください。

アルゴリズムの設定: O-Cluster

これらの設定は、O-Clusterアルゴリズムの動作に影響を与えます。

表38-15 O-CLusterの設定

設定名設定値説明

設定名	設定値	説明
`OCLT_MAX_BUFFER`	`TO_CHAR(numeric_expr` `>0)`	O-Clusterのバッファ・サイズ。デフォルトは50,000です。
`OCLT_SENSITIVITY`	`TO_CHAR(0 <=numeric_expr` `<=1)`	新しいクラスタを分割するために必要な最大密度を指定する割合。この割合は、全体の均一密度と関連しています。デフォルトは0.5です。

OCLT_MAX_BUFFER

TO_CHAR(numeric_expr >0)

O-Clusterのバッファ・サイズ。

デフォルトは50,000です。

OCLT_SENSITIVITY

TO_CHAR(0 <=numeric_expr <=1)

新しいクラスタを分割するために必要な最大密度を指定する割合。この割合は、全体の均一密度と関連しています。

デフォルトは0.5です。

関連項目:

O-Clusterの詳細は、『Oracle Data Mining概要』を参照してください。

アルゴリズムの設定: サポート・ベクター・マシン

これらの設定は、サポート・ベクター・マシン・アルゴリズムの動作に影響を与えます。SVMは、分類、回帰または異常検出（NULLターゲットを含む分類）に使用できます。

表38-16 SVMの設定

設定名	設定値	説明
`SVMS_ACTIVE_LEARNING`	`SVMS_AL_DISABLE` `SVMS_AL_ENABLE`	能動学習を有効にするか無効にするかの設定。デフォルトでは、能動学習は有効になっています。能動学習を有効にすると、SVMアルゴリズムでは能動学習を使用して、サイズが縮小されたモデルが作成されます。能動学習を無効にすると、SVMアルゴリズムでは標準モデルが作成されます。
`SVMS_COMPLEXITY_FACTOR`	`TO_CHAR(numeric_expr` `>0)`	SVMアルゴリズム（分類と回帰の両方）の複雑度の値。デフォルト値は、アルゴリズムによってデータから概算されます。
`SVMS_CONV_TOLERANCE`	`TO_CHAR(numeric_expr` `>0)`	SVMアルゴリズムでの汎用的最適化。デフォルトは0.001です。
`SVMS_EPSILON`	`TO_CHAR(numeric_expr` `>0)`	SVM回帰のイプシロン係数の値。デフォルト値は、アルゴリズムによってデータから概算されます。
`SVMS_KERNEL_CACHE_SIZE`	`TO_CHAR(numeric_expr` `>0)`	SVMアルゴリズムのカーネル・キャッシュ・サイズの値。ガウス・カーネルにのみ適用されます。デフォルトは50000000バイトです。
`SVMS_KERNEL_FUNCTION`	`svm_gaussian` `svms_linear`	サポート・ベクター・マシンのカーネル。デフォルトは、トレーニング・データでの属性の数に基づいて、アルゴリズムによって決定されます。多数の属性がある場合、アルゴリズムでは線形カーネルが使用されます。そうでない場合は、非線形（ガウス）カーネルが使用されます。属性の数は、トレーニング・データの列の数とは一致しません。アルゴリズムによって、質的属性が2項の量的属性に展開されます。また、Oracle Data Miningでは、ネストした列の各行が別々の属性として処理されます。SVMでは、カーネル機能の選択時にこれらの要素が考慮されます。
`SVMS_OUTLIER_RATE`	`TO_CHAR(0< numeric_expr` `<1)`	トレーニング・データでの目標となる外れ値率。1クラスSVMモデル（異常検出）に対してのみ有効です。デフォルトは1です。
`SVMS_STD_DEV`	`TO_CHAR(numeric_expr` `>0)`	SVMアルゴリズムの標準偏差の値。これは、ガウス・カーネルにのみ適用されます。デフォルト値は、アルゴリズムによってデータから概算されます。

関連項目:

SVMの詳細は、『Oracle Data Mining概要』を参照してください。

データ型

DBMS_DATA_MININGパッケージでは、モデル属性に関する情報を格納するためにオブジェクト・データ型が使用されます。これらの型の大部分は、テーブル・ファンクションGET_nによって戻されます。ここで、nは戻す情報の型を表します。これらのファンクションは、モデル名を入力に使用し、要求された情報を行のコレクションとして戻します。

GETファンクションのリストは、「DBMS_DATA_MININGサブプログラムの要約」を参照してください。

Oracle Data Miningでは、トランザクション・データの処理にもオブジェクト・データ型が使用されます。これらの型（DM_NESTED_NUMERICALSおよびDM_NESTED_CATEGORICALS）によって、一連のマイニング属性を1つの列に格納する場合に使用可能なネストした表が定義されます。ネストした表の詳細は、『Oracle Data Miningアプリケーション開発者ガイド』を参照してください。

すべてのテーブル・ファンクションでパイプライン出力が使用され、出力の各行がモデルの記憶域から読み取られながら実体化されるため、表オブジェクトが完全に生成されるまで待機する必要がありません。パイプライン・テーブル・ファンクションの詳細は、『Oracle Database PL/SQL言語リファレンス』を参照してください。

表38-17に、データ・マイニングのオブジェクト・データ型を示します。

表38-17 DBMS_DATA_MININGのデータ型の要約

データ型	説明
`DM_ABN_DETAIL`	Adaptive Bayes Networkモデルの属性に関する情報。
`DM_ABN_DETAILS`	`DM_ABN_DETAIL`のコレクション。 GET_MODEL_DETAILS_ABNファンクションによって戻されます。
`DM_CENTROID`	クラスタの重心。
`DM_CENTROIDS`	`DM_CENTROID`のコレクション。`DM_CLUSTER`のメンバー。
`DM_CHILD`	クラスタの子ノード。
`DM_CHILDREN`	`DM_CHILD`のコレクション。`DM_CLUSTER`のメンバー。
`DM_CLUSTER`	クラスタ。クラスタには、`DM_PREDICATES`、`DM_CHILDREN`、`DM_CENTROIDS`および`DM_HISTOGRAMS`が含まれます。また、`DM_RULE`も含まれます。
`DM_CLUSTERS`	`DM_CLUSTER`のコレクション。 GET_MODEL_DETAILS_KMファンクションおよびGET_MODEL_DETAILS_OCファンクションによって戻されます。
`DM_CONDITIONAL`	Naive Bayesモデルの属性の条件付き確率。
`DM_CONDITIONALS`	`DM_CONDITIONAL`のコレクション。GET_MODEL_DETAILS_NBファンクションによって戻されます。
`DM_COST_ELEMENT`	コスト・マトリックスの実際の値および予測値。
`DM_COST_MATRIX`	`DM_COST_ELEMENT`のコレクション。 GET_MODEL_COST_MATRIXファンクションによって戻されます。
`DM_GLM_COEFF`	一般化線形モデルの属性の係数および関連付けられている統計。
`DM_GLM_COEFF_SET`	`DM_GLM_COEFF`のコレクション。 GET_MODEL_DETAILS_GLMファンクションによって戻されます。
`DM_HISTOGRAM_BIN`	クラスタに関連付けられたヒストグラム。
`DM_HISTOGRAMS`	`DM_HISTOGRAM_BIN`のコレクション。`DM_CLUSTER`のメンバー。
`DM_ITEM`	相関ルールの項目。
`DM_ITEMS`	`DM_ITEM`のコレクション。
`DM_ITEMSET`	`DM_ITEMS`のコレクション。
`DM_ITEMSETS`	`DM_ITEMSET`のコレクション。 GET_FREQUENT_ITEMSETSファンクションによって戻されます。
`DM_MODEL_GLOBAL_DETAIL`	モデルに関する高水準の統計。
`DM_MODEL_GLOBAL_DETAILS`	`DM_MODEL_GLOBAL_DETAIL`のコレクション。 GET_MODEL_DETAILS_GLOBALファンクションによって戻されます。
`DM_MODEL_SETTING`	モデルの設定。
`DM_MODEL_SETTINGS`	`DM_MODEL_SETTING`のコレクション。 GET_MODEL_SETTINGSファンクションおよびGET_DEFAULT_SETTINGSファンクションによって戻されます。
`DM_MODEL_SIGNATURE_ATTRIBUTE`	モデルのシグネチャの属性。
`DM_MODEL_SIGNATURE`	`DM_MODEL_SIGNATURE`のコレクション。 GET_MODEL_SIGNATUREファンクションによって戻されます。
`DM_NB_DETAIL`	Naive Bayesモデルの属性に関する情報。
`DM_NB_DETAILS`	`DM_DB_DETAIL`のコレクション。GET_MODEL_DETAILS_NBファンクションによって戻されます。
`DM_NESTED_CATEGORICAL`	質的属性の名前および値。
`DM_NESTED_CATEGORICALS`	`DM_NESTED_CATEGORICAL`のコレクション。単一モデル属性として定義される属性のコレクション。トランザクション・データは、データ・マイニングに対してネストされた属性として定義されている必要があります。
`DM_NESTED_NUMERICAL`	量的属性の名前および値。
`DM_NESTED_NUMERICALS`	`DM_NESTED_NUMERICAL`のコレクション。単一モデル属性として定義される属性のコレクション。トランザクション・データは、データ・マイニングに対してネストされた属性として定義されている必要があります。
`DM_NMF_ATTRIBUTE`	Non-negative Matrix Factorizationモデルの機能の属性。
`DM_NMF_ATTRIBUTE_SET`	`DM_NMF_ATTRIBUTE`のコレクション。 `DM_NMF_FEATURE`のメンバー。
`DM_NMF_FEATURE`	Non-negative Matrix Factorizationモデルの機能。
`DM_NMF_FEATURE_SET`	`DM_NMF_FEATURE`のコレクション。 GET_MODEL_DETAILS_NMFファンクションによって戻されます。
`DM_PREDICATE`	前件および後件の属性。
`DM_PREDICATES`	`DM_PREDICATE`のコレクション。 `DM_RULE`、`DM_CLUSTER`および`DM_ABN_DETAIL`のメンバー。
`DM_RANKED_ATTRIBUTE`	属性評価モデルで重要度別にランク付けされた属性。
`DM_RANKED_ATTRIBUTES`	`DM_RANKED_ATTRIBUTE`のコレクション。 GET_MODEL_DETAILS_AIファンクションによって戻されます。
`DM_RULE`	条件付きの関係を定義するルール。このルールには、GET_ASSOCIATION_RULESファンクションによって戻される相関ルールのいずれか、またはGET_MODEL_DETAILS_KMファンクションおよびGET_MODEL_DETAILS_OCファンクションによって戻されるクラスタのコレクションでクラスタに関連付けられたルールを指定できます。
`DM_RULES`	`DM_RULE`のコレクション。 GET_ASSOCIATION_RULESファンクションによって戻されます。
`DM_SVM_ATTRIBUTE`	サポート・ベクター・マシン・モデルの属性の名前、値および係数。
`DM_SVM_ATTRIBUTE_SET`	`DM_SVM_ATTRIBUTE`のコレクション。 GET_MODEL_DETAILS_SVMファンクションによって戻されます。 `DM_SVM_LINEAR_COEFF`のメンバーでもあります。
`DM_SVM_LINEAR_COEFF`	サポート・ベクター・マシン・モデルの各属性の線形係数。
`DM_SVM_LINEAR_COEFF_SET`	`DM_SVM_LINEAR_COEFF`のコレクション。線形カーネルを使用してSVMモデルを作成する場合は、GET_MODEL_DETAILS_SVMファンクションによって戻されます。
`DM_TRANSFORM`	属性の変換式および逆変換式。
`DM_TRANSFORMS`	`DM_TRANSFORM`のコレクション。 GET_MODEL_TRANSFORMATIONSファンクションによって戻されます。
`TRANSFORM_LIST`	モデルのユーザー定義変換のリスト。パラメータとしてCREATE_MODELプロシージャで使用されます。このコレクション・タイプは、`DBMS_DATA_MINING_TRANSFORM`パッケージで定義されます。

DBMS_DATA_MININGサブプログラムの要約

表38-18に、DBMS_DATA_MININGパッケージに含まれているサブプログラムの要約を示します。

表38-18 DBMS_DATA_MININGパッケージのサブプログラム

データ型	用途
ADD_COST_MATRIXプロシージャ	分類モデルにコスト・マトリックスを追加します。
ALTER_REVERSE_EXPRESSIONプロシージャ	逆変換式を指定した式に変更します。
APPLYプロシージャ	データ・セットにモデルを適用します（データのスコアリングを行います）。
COMPUTE_CONFUSION_MATRIXプロシージャ	分類モデルのテスト・データに対する`APPLY`の結果からコンフュージョン・マトリックスを計算します。また、モデルの精度を取得します。
COMPUTE_LIFTプロシージャ	分類モデルをテスト・データに適用（`APPLY`）した結果に基づき、正数のターゲット値のリフトを計算します。
COMPUTE_ROCプロシージャ	分類モデルの受信者操作特性（ROC）を計算します。
CREATE_MODELプロシージャ	モデルを作成（構築）します。
DROP_MODELプロシージャ	モデルを削除します。
EXPORT_MODELプロシージャ	モデルをダンプ・ファイルにエクスポートします。
GET_ASSOCIATION_RULESファンクション	相関モデルからルール集合を戻します。
GET_DEFAULT_SETTINGSファンクション	マイニング機能とマイニング・アルゴリズムのすべてのデフォルト設定を戻します。
GET_FREQUENT_ITEMSETSファンクション	相関モデルの高頻度項目セットを戻します。
GET_MODEL_COST_MATRIXファンクション	モデルのコスト・マトリックスを戻します。
GET_MODEL_DETAILS_ABNファンクション	Adaptive Bayes Networkモデルのディテールを戻します。
GET_MODEL_DETAILS_AIファンクション	属性評価モデルのディテールを戻します。
GET_MODEL_DETAILS_GLMファンクション	一般化線形モデルのディテールを戻します。
GET_MODEL_DETAILS_GLOBALファンクション	モデルに関する高水準の統計を戻します。
GET_MODEL_DETAILS_KMファンクション	k-Meansモデルのディテールを戻します。
GET_MODEL_DETAILS_NBファンクション	Naive Bayesモデルのディテールを戻します。
GET_MODEL_DETAILS_NMFファンクション	NMFモデルのディテールを戻します。
GET_MODEL_DETAILS_OCファンクション	O-Clusterモデルのディテールを戻します。
GET_MODEL_DETAILS_SVMファンクション	線形カーネルを使用するSVMモデルのディテールを戻します。
GET_MODEL_DETAILS_XMLファンクション	ディシジョン・ツリー・モデルのディテールを戻します。
GET_MODEL_SETTINGSファンクション	モデルの作成に使用された設定を戻します。
GET_MODEL_SIGNATUREファンクション	モデルのシグネチャを戻します。
GET_MODEL_TRANSFORMATIONSファンクション	数多くのADP変換に加えて、モデルに埋め込まれたユーザー指定の変換定義を戻します。
GET_TRANSFORM_LISTプロシージャ	2つの異なる変換仕様形式との間を変換します。
IMPORT_MODELプロシージャ	モデルをユーザー・スキーマにインポートします。
RANK_APPLYプロシージャ	分類モデルに対する`APPLY`の結果に基づいて、予測結果をランク付けします。
REMOVE_COST_MATRIXプロシージャ	モデルからコスト・マトリックスを削除します。
RENAME_MODELプロシージャ	モデルの名前を変更します。

ADD_COST_MATRIXプロシージャ

このプロシージャは、コスト・マトリックス表を分類モデルに関連付けます。コスト・マトリックスでは、コストまたは利益を特定のモデル結果に割り当てることによって、そのモデルにバイアスをかけます。

コスト・マトリックスはモデルとともに格納され、モデルのスコアリング時に考慮されます。格納されるコスト・マトリックスは、モデルのデフォルトのスコアリング・マトリックスです。

また、スコアリングのためにData Mining SQLファンクションを起動したときに、コスト・マトリックスをインラインに指定できます。インラインのコスト・マトリックスを指定すると、デフォルトのかわりに、格納されたコスト・マトリックスが使用されます（存在する場合）。

モデルのデフォルト・スコアリング・マトリックスを取得するには、GET_MODEL_COST_MATRIXファンクションを使用します。モデルからデフォルト・スコアリング・マトリックスを削除するには、REMOVE_COST_MATRIXプロシージャを使用します。「GET_MODEL_COST_MATRIXファンクション」および「REMOVE_COST_MATRIXプロシージャ」を参照してください。

関連項目:

コストの詳細は、『Oracle Data Mining概要』の分類モデルのバイアスに関する項を参照してください。
インラインのコスト・マトリックスの構文は、『Oracle Database SQL言語リファレンス』を参照してください。

構文

DBMS_DATA_MINING.ADD_COST_MATRIX (
       model_name                IN VARCHAR2,
       cost_matrix_table_name    IN VARCHAR2,
       cost_matrix_schema_name   IN VARCHAR2 DEFAULT NULL);

パラメータ

表38-19 ADD_COST_MATRIXプロシージャのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、ユーザー独自のスキーマが使用されます。
`cost_matrix_table_name`	コスト・マトリックス表の名前（表38-20を参照）。
`cost_matrix_schema_name`	コスト・マトリックス表のスキーマ。スキーマが指定されない場合は、現行のスキーマが使用されます。

使用上の注意

モデルがスキーマにない場合、ADD_COST_MATRIXでは、ALTER ANY MINING MODELシステム権限またはそのマイニング・モデルに対するALTERオブジェクト権限が必要です。

コスト・マトリックス表には、表38-20に示す列が必要です。実際のターゲット値と予測されるターゲット値のデータ型は、同じである必要があります。

表38-20 コスト・マトリックス表に必要な列

列名データ型

列名	データ型
`ACTUAL_TARGET_VALUE`	質的ターゲットの場合は`VARCHAR2(4000)` 量的ターゲットの場合は`NUMBER`
`PREDICTED_TARGET_VALUE`	質的ターゲットの場合は`VARCHAR2(4000)` 量的ターゲットの場合は`NUMBER`
`COST`	`NUMBER`

ACTUAL_TARGET_VALUE

質的ターゲットの場合はVARCHAR2(4000)

量的ターゲットの場合はNUMBER

PREDICTED_TARGET_VALUE

質的ターゲットの場合はVARCHAR2(4000)

量的ターゲットの場合はNUMBER

COST

NUMBER

利益は負のコストとして表示できるため、コスト・マトリックス表のCOST列に負の数値を指定すると、特定の結果に利益を指定できます。
すべての分類アルゴリズムで、スコアリングのためにコスト・マトリックスを使用できます。また、ディシジョン・ツリー・アルゴリズムでは、作成時でもコスト・マトリックスを使用できます。コスト・マトリックスを使用してディシジョン・ツリー・モデルを作成する場合、モデルの設定表のCLAS_COST_TABLE_NAME設定にコスト・マトリックス表の名前を指定します。表38-7「マイニング機能の設定」を参照してください。

ディシジョン・ツリー・モデルを作成する場合に使用するコスト・マトリックスは、そのモデルに対するデフォルトのスコアリング・マトリックスになります。スコアリング用に異なるコストを指定する場合は、REMOVE_COST_MATRIXプロシージャを使用してコスト・マトリックスを削除し、ADD_COST_MATRIXプロシージャを使用して新規コスト・マトリックスを追加します。

例

この例では、COSTS_NBというコスト・マトリックス表を作成し、NB_SH_CLAS_SAMPLEというNaive Bayesモデルに追加します。このモデルには、バイナリ・ターゲットがあります。1は顧客がプロモーションに応答することを表し、0は顧客が応答しないことを表します。コスト・マトリックスは、応答しない顧客の分類ミスに0.25のコストを割り当て、応答する顧客の分類ミスに0.75のコストを割り当てます。これは、応答しない顧客の分類ミスよりも、応答する顧客の分類ミスの方が3倍コストがかかることを意味します。

CREATE TABLE costs_nb (
  actual_target_value           NUMBER,
  predicted_target_value        NUMBER,
  cost                          NUMBER);
INSERT INTO costs_nb values (0, 0, 0);
INSERT INTO costs_nb values (0, 1, .25);
INSERT INTO costs_nb values (1, 0, .75);
INSERT INTO costs_nb values (1, 1, 0);
COMMIT;

EXEC dbms_data_mining.add_cost_matrix('nb_sh_clas_sample', 'costs_nb');

SELECT cust_gender, COUNT(*) AS cnt, ROUND(AVG(age)) AS avg_age
   FROM mining_data_apply_v
   WHERE PREDICTION(nb_sh_clas_sample COST MODEL
      USING cust_marital_status, education, household_size) = 1
   GROUP BY cust_gender
   ORDER BY cust_gender;

C        CNT    AVG_AGE
- ---------- ----------
F         72         39
M        555         44

ALTER_REVERSE_EXPRESSIONプロシージャ

このプロシージャは、逆変換式を指定した式に変更します。

変換式は、モデルの作成に使用される前に属性を変更する方法を指定します。逆変換式は、モデルの透過性のために、属性を元の形式（または元の形式の近似処理）に戻す方法を指定します。

GET_MODEL_DETAILSファンクションは、モデルの属性に関する情報を戻す前に逆変換式に適用されます。ターゲットが変換されると、逆変換がスコアリングの結果に適用されます。詳細は、「使用上の注意」を参照してください。

ALTER_REVERSE_EXPRESSIONを使用すると、名前/説明をクラスタまたは機能と関連付けることができます。モデルのスコアリング時に、指定した記述子が表示されます。CLUSTER_ID、CLUSTER_PROBABILITYおよびCLUSTER_SETファンクションを使用すると、クラスタリング・モデルをスコアリングできます。 FEATURE_ID、FEATURE_SETまたはFEATURE_VALUEファンクションを使用すると、特徴抽出モデルをスコアリングできます。詳細は、例および『Oracle Database SQL言語リファレンス』を参照してください。

ALTER_REVERSE_EXPRESSIONを使用すると、名前/説明を異常検出モデルの結果と関連付けることができます。これらのモデルでは、1クラスSVMを使用して、レコードごとに1または0のいずれか（レコードが異常かどうかを示す）が予測されます。 ALTER_REVERSE_EXPRESSIONでは、ゼロまたは1をもっと意味のあるラベルに置き換えることができます。

構文

DBMS_DATA_MINING. ALTER_REVERSE_EXPRESSION (
         model_name             VARCHAR2,
         expression             CLOB,
         attribute_name         VARCHAR2 DEFAULT NULL,
         attribute_subname      VARCHAR2 DEFAULT NULL);

パラメータ

表38-21 ALTER_REVERSE_EXPRESSIONプロシージャのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。
`expression`	SQL式。
`attribute_name`	属性の名前。`expression`をクラスタ、機能または1クラスSVMの予測に適用する場合は、`NULL`に設定します。
`attribute_subname`	`attribute_name`がネストされた列の場合はネストされた属性の名前。それ以外の場合は`NULL`。

使用上の注意

自動データ準備を使用する場合、変換および逆変換はシステムによって自動的に実行されます。モデルを作成すると、システムで生成される式に加えて適用される変換および逆変換を指定できます。自動データ準備を使用しない場合、指定した変換および逆変換のみが適用されます。

例

この例では、sh_clusモデルから生成されたクラスタにラベルを指定します。このラベルは、「クラスタ」という単語およびクラスタの内部数値識別子で構成されます。

SQL> begin
  2    dbms_data_mining.alter_reverse_expression(
  3      'sh_clus', '''Cluster ''||value');
  4  end;
  5  /

SQL> select cust_id, cluster_id(sh_clus using *) cluster_id
  2    from sh_aprep_num
  3   where cust_id < 100011
  4   order by cust_id;

CUST_ID CLUSTER_ID
------- ------------------------------------------------
 100001 Cluster 18
 100002 Cluster 14
 100003 Cluster 14
 100004 Cluster 18
 100005 Cluster 19
 100006 Cluster 7
 100007 Cluster 18
 100008 Cluster 14
 100009 Cluster 8
 100010 Cluster 8

APPLYプロシージャ

このプロシージャは、対象データにマイニング・モデルを適用し、その結果を表に保存します。適用プロセスは、スコアリングとも呼ばれます。

予測マイニング機能の適用プロセスでは、予測結果がターゲット列に生成されます。クラスタリングなどの記述マイニング機能の適用プロセスでは、各ケースにクラスタが確率付きで割り当てられます。

Oracle Data Miningでは、適用操作は、相関モデルおよび属性評価モデルには適用できません。

注意:

データ・マイニング機能を使用すると、SQLで直接スコアリングを実行することもできます。詳細は、『Oracle Data Miningアプリケーション開発者ガイド』のスコアリングおよびデプロイメントに関する項を参照してください。

構文

DBMS_DATA_MINING.APPLY (
      model_name           IN VARCHAR2,
      data_table_name      IN VARCHAR2,
      case_id_column_name  IN VARCHAR2,
      result_table_name    IN VARCHAR2,
      data_schema_name     IN VARCHAR2 DEFAULT NULL);

パラメータ

表38-22 APPLYプロシージャのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。
`data_table_name`	スコアリング対象のデータが保存された表またはビューの名前。
`case_id_column_name`	ケースID列の名前。
`result_table_name`	適用結果が保存される表の名前。
`data_schema_name`	スコアリング対象のデータが保存されたスキーマの名前。

使用上の注意

APPLYに指定したデータでは、モデルの作成およびテストに使用されるデータと同じ事前処理が実行される必要があります。自動データ準備を使用する場合、アルゴリズムで必要な事前処理は、作成時と適用時の両方で、ユーザーのかわりにモデルによって処理されます。（「自動データ準備」を参照）

APPLYでは、ユーザーのスキーマに表を作成して結果を保存します。列はアルゴリズム固有です。

結果表の列は、表38-23から表38-27で説明します。結果表のケースID列名は、ユーザーが指定したケースID列名と同じ値になります。入力のケースID列の型は、APPLYの出力でも維持されます。

注意:

ケースID列が、APPLYで作成されるいずれの列の名前とも同じにならないことを確認してください。たとえば、分類モデルを適用した場合、スコアリング・データのケースIDは、PREDICTIONとPROBABILITYのいずれにもならないようにする必要があります（表38-23を参照）。

出力列'PREDICTION'、'CLUSTER_ID'および'FEATURE_ID'のデータ型は、ユーザーがモデルに埋め込んだ反転式によって影響を受けます。ユーザーがスコアリング値の型を変更する反転式を指定しない場合は、その型は次の表の説明に従います。詳細は、「ALTER_REVERSE_EXPRESSIONプロシージャ」を参照してください。

分類

分類の結果表には、表38-23に示す列があります。モデルが質的ターゲットの場合、PREDICTION列のデータ型はVARCHAR2になります。モデルが量的ターゲットの場合、PREDICTION列のデータ型はNUMBERになります。

表38-23 分類に対するAPPLYの適用結果表

列名	データ型
ケースID列の名前	`VARCHAR2`または`NUMBER`
`PREDICTION`	`VARCHAR2`または`NUMBER`
`PROBABILITY`	`NUMBER`

1クラスSVM（異常検出）

異常検出の結果表には、表38-24に示す列があります。

表38-24 異常検出に対するAPPLYの適用結果表

列名	データ型
ケースID列の名前	`VARCHAR2`または`NUMBER`
`PREDICTION`	`NUMBER`
`PROBABILITY`	`NUMBER`

PREDICTION列の値は、0または1のいずれかです。1の場合、ケースは標準的な例です。0の場合、ケースは外れ値です。

SVMまたはGLMを使用した回帰

回帰の結果表には、表38-25に示す列があります。

表38-25 回帰に対するAPPLYの適用結果表

列名	データ型
ケースID列の名前	`VARCHAR2`または`NUMBER`
`PREDICTION`	`NUMBER`

k-MeansまたはO-Clusterを使用するクラスタリング

クラスタリングは監視なしのマイニング機能であるため、ターゲットは存在しません。APPLY操作の結果は、単にケースに対応するクラスタ識別子と、ケースの確率のみになります。結果表には、表38-26に示す列があります。

表38-26 クラスタリングに対するAPPLYの適用結果表

列名	データ型
ケースID列の名前	`VARCHAR2`または`NUMBER`
`CLUSTER_ID`	`NUMBER`
`PROBABILITY`	`NUMBER`

NMFを使用する特徴抽出

特徴抽出も監視なしのマイニング機能であるため、ターゲットは存在しません。APPLY操作の結果は、単にケースに対応する機能識別子と、ケースの一致率のみになります。結果表には、表38-27に示す列があります。

表38-27 特徴抽出に対するAPPLYの適用結果表

列名	データ型
ケースID列の名前	`VARCHAR2`または`NUMBER`
`FEATURE_ID`	`NUMBER`
`MATCH_QUALITY`	`NUMBER`

例

この例では、GLM回帰モデルGLMR_SH_REGR_SAMPLEをMINING_DATA_APPLY_Vビューのデータに適用します。適用結果は、REGRESSION_APPLY_RESULT表に出力されます。

SQL> BEGIN
       DBMS_DATA_MINING.APPLY (
       model_name     => 'glmr_sh_regr_sample',
       data_table_name     => 'mining_data_apply_v',
       case_id_column_name => 'cust_id',
       result_table_name   => 'regression_apply_result');
    END;
    /

SQL> SELECT * FROM regression_apply_result WHERE cust_id >  101485;

   CUST_ID PREDICTION
---------- ----------
    101486 22.8048824
    101487 25.0261101
    101488 48.6146619
    101489   51.82595
    101490 22.6220714
    101491 61.3856816
    101492 24.1400748
    101493  58.034631
    101494 45.7253149
    101495 26.9763318
    101496 48.1433425
    101497 32.0573434
    101498 49.8965531
    101499  56.270656
    101500 21.1153047

COMPUTE_CONFUSION_MATRIXプロシージャ

このプロシージャは、コンフュージョン・マトリックスを計算してユーザーのスキーマにある表に格納し、モデルの精度を戻します。

コンフュージョン・マトリックスは、分類モデルに対するテスト指標値です。一連のテスト・データにおいて、モデルによって生成された予測結果が実際のターゲット値と比較されます。マトリックスはn-by-nであり、nはクラスの数を表します。コンフュージョン・マトリックスには、各クラスが正しく予測された回数と、各クラスが他のクラスのいずれかになると予測された回数がリストされます。

COMPUTE_CONFUSION_MATRIXは、次の3つの入力ストリームを受け入れます。

テスト・データに対して生成された予測結果。この情報は、次の3つの列で渡されます。
- ケースID列
- 予測列
- 確率とコストのいずれかが格納されているスコアリング基準列
テスト・データの既知のターゲット値。この情報は、次の2つの列で渡されます。
- ケースID列
- 既知のターゲット値が格納されているターゲット列
（オプション）事前定義された列を持つコスト・マトリックス表。列の要件については、「使用上の注意」を参照してください。

関連項目:

コンフュージョン・マトリックスおよび分類用の他のテスト指標値の詳細は、『Oracle Data Mining概要』を参照してください。

「COMPUTE_LIFTプロシージャ」

「COMPUTE_ROCプロシージャ」

構文

DBMS_DATA_MINING.COMPUTE_CONFUSION_MATRIX (
      accuracy                     OUT NUMBER,
      apply_result_table_name      IN  VARCHAR2,
      target_table_name            IN  VARCHAR2,
      case_id_column_name          IN  VARCHAR2,
      target_column_name           IN  VARCHAR2,
      confusion_matrix_table_name  IN  VARCHAR2,
      score_column_name            IN  VARCHAR2 DEFAULT 'PREDICTION',
      score_criterion_column_name  IN  VARCHAR2 DEFAULT 'PROBABILITY',
      cost_matrix_table_name       IN  VARCHAR2 DEFAULT NULL,
      apply_result_schema_name     IN  VARCHAR2 DEFAULT NULL,
      target_schema_name           IN  VARCHAR2 DEFAULT NULL,
      cost_matrix_schema_name      IN  VARCHAR2 DEFAULT NULL,
      score_criterion_type         IN  VARCHAR2 DEFAULT 'PROBABILITY');

パラメータ

表38-28 COMPUTE_CONFUSION_MATRIXプロシージャのパラメータ

パラメータ	説明
`accuracy`	予測の全体的な精度（パーセント）が含まれる出力パラメータ。
`apply_result_table_name`	予測結果が含まれる表。
`target_table_name`	テスト・データの既知のターゲット値が含まれる表。
`case_id_column_name`	適用結果表のケースID列。ターゲット表のケースIDと一致する必要があります。
`target_column_name`	ターゲット表のターゲット列。テスト・データの既知のターゲット値が格納されます。
`confusion_matrix_table_name`	コンフュージョン・マトリックスが含まれる表。この表は、このプロシージャによってユーザーのスキーマ内に作成されます。コンフュージョン・マトリックス表の列については、「使用上の注意」を参照してください。
`score_column_name`	適用結果表の予測結果が格納される列。デフォルトの列名は`PREDICTION`です。この列名は、`APPLY`プロシージャで作成されるデフォルト名です（「APPLYプロシージャ」を参照）。
`score_criterion_column_name`	適用結果表のスコアリング基準値が格納される列。予測を決定する確率またはコストが格納されます。デフォルトでは、スコアリングは確率に基づくため、各ケースに対して最も確率の高いクラスが予測されます。スコアリングがコストに基づく場合は、最もコストの低いクラスが予測されます。 `score_criterion_type`パラメータは、スコアリングに確率またはコストのいずれを使用するのかを示します。デフォルトの列名は'`PROBABILITY`'です。この列名は、`APPLY`プロシージャで作成されるデフォルト名です（「APPLYプロシージャ」を参照）。詳細は、「使用上の注意」を参照してください。
`cost_matrix_table_name`	（オプション）分類ミスに関連付けられたコストを定義する表。コスト・マトリックス表があり、`score_criterion_type`パラメータが`'COSTS'`に設定されている場合は、スコアリング基準としてこの表のコストが使用されます。コスト・マトリックス表の列については、「使用上の注意」を参照してください。
`apply_result_schema_name`	適用結果表のスキーマ。 NULLの場合、ユーザーのスキーマと想定されます。
`target_schema_name`	既知のターゲットが含まれる表のスキーマ。 NULLの場合、ユーザーのスキーマと想定されます。
`cost_matrix_schema_name`	コスト・マトリックス表のスキーマ（指定されている場合）。 NULLの場合、ユーザーのスキーマと想定されます。
`score_criterion_type`	スコアリング基準として確率またはコストのいずれを使用するか。確率またはコストは、`score_criterion_column_name`パラメータで識別される列に渡されます。 `score_criterion_type`のデフォルト値は`'PROBABILITY'`です。スコアリング基準としてコストを使用するには、`'COST'`と指定します。 `score_criterion_type`が'`COST`'に設定されているにもかかわらずコスト・マトリックスがない場合に、モデルにスコアリング・コスト・マトリックスが関連付けられていると、この関連付けられているコストがスコアリングに使用されます。「使用上の注意」および「例」を参照してください。

使用上の注意

COMPUTE_CONFUSION_MATRIXに渡す予測情報は、SQLファンクションPREDICTION、DBMS_DATA_MINING.APPLYプロシージャまたはその他のメカニズムを使用して生成できます。プロシージャは、渡すデータが適切な場合にかぎり、コンフュージョン・マトリックスを計算できます。
COMPUTE_CONFUSION_MATRIXにコスト・マトリックスを渡すかわりに、モデルに関連付けられているスコアリング・コスト・マトリックスを使用できます。スコアリング・コスト・マトリックスは、モデルに埋め込むか、またはモデルの適用時に動的に定義できます。スコアリング・コスト・マトリックスを使用するには、SQLファンクションPREDICTION_COSTを起動して、スコア基準列を移入します。

COMPUTE_CONFUSION_MATRIXに渡す予測情報は、apply_result_table_nameで指定した表またはビューに格納されます。

CREATE TABLE apply_result_table_name AS (
            case_id_column_name            VARCHAR2,
            score_column_name              VARCHAR2,
            score_criterion_column_name    VARCHAR2);

コスト・マトリックスには、表38-29に示す列が必要です。

表38-29 コスト・マトリックスの列

列名データ型

actual_target_value

NUMBERまたはVARCHAR2

predicted_target_value

NUMBERまたはVARCHAR2

cost

NUMBER

関連項目:
コスト・マトリックスの詳細は、『Oracle Data Mining概要』を参照してください。
COMPUTE_CONFUSION_MATRIXで作成されるコンフュージョン・マトリックスには、表38-30に示す列があります。

表38-30 コンフュージョン・マトリックスの列

列名データ型

actual_target_value

NUMBERまたはVARCHAR2

predicted_target_value

NUMBERまたはVARCHAR2

value

NUMBER

関連項目:
コンフュージョン・マトリックスの詳細は、『Oracle Data Mining概要』を参照してください。

例

ここに示す例では、Naive Bayesモデルnb_sh_clas_sampleが使用されています。このモデルは、Oracle Data Miningのサンプル・プログラムによって作成されます。

確率に基づくコンフュージョン・マトリックスの計算

次の文は、テスト・データにモデルを適用し、予測結果と確率を表に格納します。

CREATE TABLE nb_apply_results AS
       SELECT cust_id,
              PREDICTION(nb_sh_clas_sample USING *) prediction,
              PREDICTION_PROBABILITY(nb_sh_clas_sample USING *) probability
       FROM mining_data_test_v;

スコアリング基準として確率を使用する場合は、次のようにコンフュージョン・マトリックスを計算できます。

DECLARE
   v_accuracy    NUMBER;
      BEGIN
        DBMS_DATA_MINING.COMPUTE_CONFUSION_MATRIX (
                   accuracy                     => v_accuracy,
                   apply_result_table_name      => 'nb_apply_results',
                   target_table_name            => 'mining_data_test_v',
                   case_id_column_name          => 'cust_id',
                   target_column_name           => 'affinity_card',
                   confusion_matrix_table_name  => 'nb_confusion_matrix',
                   score_column_name            => 'PREDICTION',
                   score_criterion_column_name  => 'PROBABILITY'
                   cost_matrix_table_name       =>  null,                   apply_result_schema_name     =>  null,                   target_schema_name           =>  null,                   cost_matrix_schema_name      =>  null,                   score_criterion_type         => 'PROBABILITY');
        DBMS_OUTPUT.PUT_LINE('**** MODEL ACCURACY ****: ' || ROUND(v_accuracy,4));
      END;
      /

コンフュージョン・マトリックスとモデルの精度は、次のとおりです。

 **** MODEL ACCURACY ****: .7847

SQL>SELECT * from nb_confusion_matrix;
ACTUAL_TARGET_VALUE PREDICTED_TARGET_VALUE      VALUE
------------------- ---------------------- ----------
                  1                      0         60
                  0                      0        891
                  1                      1        286
                  0                      1        263

コスト・マトリックス表に基づくコンフュージョン・マトリックスの計算

前述の例のコンフュージョン・マトリックスは、高い偽陽性率を示しています。 263のケースで、実際の値が0（ゼロ）であるにもかかわらず、モデルでは1と予測されました。コスト・マトリックスを使用すると、このようなエラーを最小限に抑えることができます。

コスト・マトリックス表nb_cost_matrixから、偽陽性は偽陰性の3倍以上のコストがかかることがわかります。

SQL> SELECT * from nb_cost_matrix;
ACTUAL_TARGET_VALUE PREDICTED_TARGET_VALUE       COST
------------------- ---------------------- ----------
                  0                      0          0
                  0                      1        .75
                  1                      0        .25
                  1                      1          0

次の文は、APPLYを使用して予測を生成する方法を示しています。

BEGIN
    DBMS_DATA_MINING.APPLY(
          model_name          => 'nb_sh_clas_sample',
          data_table_name     => 'mining_data_test_v',
          case_id_column_name => 'cust_id',
          result_table_name   => 'nb_apply_results');
 END;
/

この文では、コスト・マトリックス表を使用してコンフュージョン・マトリックスが計算されます。スコア基準列の名前は'PROBABILITY'です。この列名は、APPLYで生成される名前です。

DECLARE
  v_accuracy    NUMBER;
     BEGIN
       DBMS_DATA_MINING.COMPUTE_CONFUSION_MATRIX (
                accuracy                     => v_accuracy,
                apply_result_table_name      => 'nb_apply_results',
                target_table_name            => 'mining_data_test_v',
                case_id_column_name          => 'cust_id',
                target_column_name           => 'affinity_card',
                confusion_matrix_table_name  => 'nb_confusion_matrix',
                score_column_name            => 'PREDICTION',
                score_criterion_column_name  => 'PROBABILITY',
                cost_matrix_table_name       => 'nb_cost_matrix',
                apply_result_schema_name     => null,
                target_schema_name           => null,
                cost_matrix_schema_name      => null,
                score_criterion_type         => 'COST');
       DBMS_OUTPUT.PUT_LINE('**** MODEL ACCURACY ****: ' || ROUND(v_accuracy,4));
    END;
    /

生成されるコンフュージョン・マトリックスは、（263から212に）偽陽性が低下したことを示しています。

**** MODEL ACCURACY ****: .798

SQL> SELECT * FROM nb_confusion_matrix;
ACTUAL_TARGET_VALUE PREDICTED_TARGET_VALUE      VALUE
------------------- ---------------------- ----------
                  1                      0         91
                  0                      0        942
                  1                      1        255
                  0                      1        212

埋め込まれたコストに基づくコンフュージョン・マトリックスの計算

ADD_COST_MATRIXプロシージャを使用すると、モデルにコスト・マトリックスを埋め込むことができます。埋め込まれたコストは、確率のかわりにスコアリングに使用できます。次の文は、以前に定義済のコスト・マトリックスをモデルに追加します。

BEGIN    DBMS_DATA_MINING.ADD_COST_MATRIX ('nb_sh_clas_sample', 'nb_cost_matrix');END;/

次の文は、埋め込まれたコストを使用してテスト・データにモデルを適用し、結果を表に格納します。

CREATE TABLE nb_apply_results AS
         SELECT cust_id,
              PREDICTION(nb_sh_clas_sample COST MODEL USING *) prediction,
              PREDICTION_COST(nb_sh_clas_sample COST MODEL USING *) cost
          FROM mining_data_test_v;

埋め込まれたコストを使用してコンフュージョン・マトリックスを計算できます。

DECLARE
   v_accuracy         NUMBER;
   BEGIN
       DBMS_DATA_MINING.COMPUTE_CONFUSION_MATRIX (
            accuracy                     => v_accuracy,
            apply_result_table_name      => 'nb_apply_results',
            target_table_name            => 'mining_data_test_v',
            case_id_column_name          => 'cust_id',
            target_column_name           => 'affinity_card',
            confusion_matrix_table_name  => 'nb_confusion_matrix',
            score_column_name            => 'PREDICTION',
            score_criterion_column_name  => 'COST',
            cost_matrix_table_name       => null,
            apply_result_schema_name     => null,
            target_schema_name           => null,
            cost_matrix_schema_name      => null,
            score_criterion_type         => 'COST');
   END;
   /

結果は次のとおりです。

**** MODEL ACCURACY ****: .798

SQL> SELECT * FROM nb_confusion_matrix;
ACTUAL_TARGET_VALUE PREDICTED_TARGET_VALUE      VALUE
------------------- ---------------------- ----------
                  1                      0         91
                  0                      0        942
                  1                      1        255
                  0                      1        212

COMPUTE_LIFTプロシージャ

このプロシージャは、リフトを計算し、ユーザーのスキーマにある表に結果を格納します。

リフトは、バイナリ分類モデルに対するテスト指標値です。リフトを計算するには、ターゲット値のいずれかをポジティブ・クラスに指定する必要があります。 COMPUTE_LIFTでは、一連のテスト・データにおいて、モデルによって生成された予測結果が実際のターゲット値と比較されます。リフトでは、モデルによるポジティブ・クラスの予測結果が、ランダムに選択した場合と比較してどの程度向上しているかが測定されます。

リフトは、確率（またはコスト）によってランク付けされてクオンタイルに分割されたスコアリング結果に対して計算されます。各クオンタイルには、同じ数のケースのスコアが含まれます。

COMPUTE_LIFTでは、クオンタイルに基づく累積統計情報が計算されます。クオンタイルの数およびポジティブ・クラスはユーザーが指定します。また、COMPUTE_LIFTは、次の3つの入力ストリームを受け入れます。

テスト・データに対して生成された予測結果。この情報は、次の3つの列で渡されます。
- ケースID列
- 予測列
- 予測に関連付けられた確率とコストのいずれかが格納されているスコアリング基準列
テスト・データの既知のターゲット値。この情報は、次の2つの列で渡されます。
- ケースID列
- 既知のターゲット値が格納されているターゲット列
（オプション）事前定義された列を持つコスト・マトリックス表。列の要件については、「使用上の注意」を参照してください。

関連項目:

リフトおよび分類用のテスト指標値の詳細は、『Oracle Data Mining概要』を参照してください。

「COMPUTE_CONFUSION_MATRIXプロシージャ」

「COMPUTE_ROCプロシージャ」

構文

DBMS_DATA_MINING.COMPUTE_LIFT (
      apply_result_table_name      IN VARCHAR2,
      target_table_name            IN VARCHAR2,
      case_id_column_name          IN VARCHAR2,
      target_column_name           IN VARCHAR2,
      lift_table_name              IN VARCHAR2,
      positive_target_value        IN VARCHAR2,
      score_column_name            IN VARCHAR2 DEFAULT 'PREDICTION',
      score_criterion_column_name  IN VARCHAR2 DEFAULT 'PROBABILITY',
      num_quantiles                IN NUMBER DEFAULT 10,
      cost_matrix_table_name       IN VARCHAR2 DEFAULT NULL,
      apply_result_schema_name     IN VARCHAR2 DEFAULT NULL,
      target_schema_name           IN VARCHAR2 DEFAULT NULL,
      cost_matrix_schema_name      IN VARCHAR2 DEFAULT NULL
      score_criterion_type         IN VARCHAR2 DEFAULT 'PROBABILITY');

パラメータ

表38-31 COMPUTE_LIFTプロシージャのパラメータ

パラメータ	説明
`apply_result_table_name`	予測結果が含まれる表。
`target_table_name`	テスト・データの既知のターゲット値が含まれる表。
`case_id_column_name`	適用結果表のケースID列。ターゲット表のケースIDと一致する必要があります。
`target_column_name`	ターゲット表のターゲット列。テスト・データの既知のターゲット値が格納されます。
`lift_table_name`	リフト統計情報が含まれる表。この表は、このプロシージャによってユーザーのスキーマ内に作成されます。リフト表の列については、「使用上の注意」を参照してください。
`positive_target_value`	ポジティブ・クラス。リフトの計算対象となるクラスです。ターゲット列が`NUMBER`である場合は、`TO_CHAR()`演算子を使用して数値を文字列に変換します。
`score_column_name`	適用結果表の予測結果が格納される列。デフォルトの列名は'`PREDICTION`'です。この列名は、`APPLY`プロシージャで作成されるデフォルト名です（「APPLYプロシージャ」を参照）。
`score_criterion_column_name`	適用結果表のスコアリング基準値が格納される列。予測を決定する確率またはコストが格納されます。デフォルトでは、スコアリングは確率に基づくため、各ケースに対して最も確率の高いクラスが予測されます。スコアリングがコストに基づく場合は、最もコストの低いクラスが予測されます。 `score_criterion_type`パラメータは、スコアリングに確率またはコストのいずれを使用するのかを示します。デフォルトの列名は'`PROBABILITY`'です。この列名は、`APPLY`プロシージャで作成されるデフォルト名です（「APPLYプロシージャ」を参照）。詳細は、「使用上の注意」を参照してください。
`num_quantiles`	リフト計算に使用するクオンタイル数。デフォルトは10です。
`cost_matrix_table_name`	（オプション）分類ミスに関連付けられたコストを定義する表。コスト・マトリックス表があり、`score_criterion_type`パラメータが'`COSTS`'に設定されている場合、スコアリング基準としてこの表のコストが使用されます。コスト・マトリックス表の列については、「使用上の注意」を参照してください。
`apply_result_schema_name`	適用結果表のスキーマ。 NULLの場合、ユーザーのスキーマと想定されます。
`target_schema_name`	既知のターゲットが含まれている表のスキーマ。 NULLの場合、ユーザーのスキーマと想定されます。
`cost_matrix_schema_name`	コスト・マトリックス表のスキーマ（指定されている場合）。 NULLの場合、ユーザーのスキーマと想定されます。
`score_criterion_type`	スコアリング基準として確率またはコストのいずれを使用するか。確率またはコストは、`score_criterion_column_name`パラメータで識別される列に渡されます。 `score_criterion_type`のデフォルト値は'`PROBABILITY`'です。スコアリング基準としてコストを使用するには、'`COST`'と指定します。 `score_criterion_type`が'`COST`'に設定されているにもかかわらずコスト・マトリックスがない場合に、モデルにスコアリング・コスト・マトリックスが関連付けられていると、この関連付けられているコストがスコアリングに使用されます。「使用上の注意」および「例」を参照してください。

使用上の注意

COMPUTE_LIFTに渡す予測情報は、SQLファンクションPREDICTION、DBMS_DATA_MINING.APPLYプロシージャまたはその他のメカニズムを使用して生成できます。プロシージャは、渡すデータが適切な場合にかぎり、リフトを計算できます。
COMPUTE_LIFTにコスト・マトリックスを渡すかわりに、モデルに関連付けられているスコアリング・コスト・マトリックスを使用できます。スコアリング・コスト・マトリックスは、モデルに埋め込むか、またはモデルの適用時に動的に定義できます。スコアリング・コスト・マトリックスを使用するには、SQLファンクションPREDICTION_COSTを起動して、スコア基準列を移入します。

COMPUTE_LIFTに渡す予測情報は、apply_results_table_nameで指定した表またはビューに格納されます。

CREATE TABLE apply_result_table_name AS (
            case_id_column_name            VARCHAR2,
            score_column_name              VARCHAR2,
            score_criterion_column_name    VARCHAR2);

コスト・マトリックスには、表38-32に示す列が必要です。

表38-32 コスト・マトリックスの列

列名データ型

actual_target_value

NUMBERまたはVARCHAR2

predicted_target_value

NUMBERまたはVARCHAR2

cost

NUMBER

関連項目:
コスト・マトリックスの詳細は、『Oracle Data Mining概要』を参照してください。

COMPUTE_LIFTで作成される表には、表38-33に示す列があります。

表38-33 リフト表の列

列名	データ型
`quantile_number`	`NUMBER`
`probability_threshold`	`NUMBER`
`gain_cumulative`	`NUMBER`
`quantile_total_count`	`NUMBER`
`quantile_target_count`	`NUMBER`
`percent_records_cumulative`	`NUMBER`
`lift_cumulative`	`NUMBER`
`target_density_cumulative`	`NUMBER`
`targets_cumulative`	`NUMBER`
`non_targets_cumulative`	`NUMBER`
`lift_quantile`	`NUMBER`
`target_density`	`NUMBER`

関連項目:

リフト表の詳細は、『Oracle Data Mining概要』を参照してください。

COMPUTE_LIFTにコスト・マトリックスが渡されると、リフト表のprobability_threshold列にコストしきい値が戻されます。

例

ここに示す例では、Naive Bayesモデルnb_sh_clas_sampleが使用されています。このモデルは、Oracle Data Miningのサンプル・プログラムによって作成されます。

この例は、確率に基づくリフトを示しています。コストに基づく計算を示す例については、「COMPUTE_CONFUSION_MATRIXプロシージャ」を参照してください。

確率に基づくリフトの計算

次の文は、テスト・データにモデルを適用し、予測結果と確率を表に格納します。

CREATE TABLE nb_apply_results AS
          SELECT cust_id,
                      PREDICTION(nb_sh_clas_sample USING *) prediction,
                       PREDICTION_PROBABILITY(nb_sh_clas_sample USING *) probability
            FROM mining_data_test_v;

スコアリング基準として確率を使用する場合は、次のようにリフトを計算できます。

BEGIN
           DBMS_DATA_MINING.COMPUTE_LIFT (
              apply_result_table_name            => 'nb_apply_results',
              target_table_name                    => 'mining_data_test_v',
              case_id_column_name                    => 'cust_id',
              target_column_name                   => 'affinity_card',
              lift_table_name                         => 'nb_lift',
              positive_target_value             =>  to_char(1),
              score_column_name                    => 'PREDICTION',
              score_criterion_column_name    => 'PROBABILITY',
              num_quantiles                                  =>  10,
              cost_matrix_table_name              =>  null,
              apply_result_schema_name          =>  null,
              target_schema_name                   =>  null,
              cost_matrix_schema_name            =>  null,
              score_criterion_type               =>  'PROBABILITY');
        END;
        /

この問合せにより、生成されるリフト表の統計情報の一部が表示されます。

SQL>SELECT quantile_number, probability_threshold, gain_cumulative,
           quantile_total_count
           FROM nb_lift;

QUANTILE_NUMBER PROBABILITY_THRESHOLD GAIN_CUMULATIVE QUANTILE_TOTAL_COUNT
--------------- --------------------- --------------- --------------------
              1            .989335775       .15034965                   55
              2            .980534911       .26048951                   55
              3            .968506098      .374125874                   55
              4            .958975196      .493006993                   55
              5            .946705997      .587412587                   55
              6            .927454174       .66958042                   55
              7            .904403627      .748251748                   55
              8            .836482525      .839160839                   55
             10            .500184953               1                   54

COMPUTE_ROCプロシージャ

このプロシージャは、受信者操作特性（ROC）を計算してユーザーのスキーマにある表に結果を格納し、モデルの精度を戻します。

ROCは、バイナリ分類モデルに対するテスト指標値です。 ROCを計算するには、ターゲット値のいずれかをポジティブ・クラスに指定する必要があります。 COMPUTE_ROCでは、一連のテスト・データにおいて、モデルによって生成された予測結果が実際のターゲット値と比較されます。

ROCは、確率しきい値における変化の影響を測定します。確率しきい値は、モデルが予測に使用する決定ポイントです。バイナリ分類では、デフォルトの確率しきい値は0.5です。それぞれのケースに対して、確率が50%を超える値が予測されます。

ROCは、X-Y軸上の曲線として描くことができます。 X軸を偽陽性率にします。 Y軸を真陽性率にします。偽陽性とは、陰性であるものがテスト・データで陽性と予測されることです。真陽性とは、陽性であるものがテスト・データで陽性と予測されることです。

COMPUTE_ROCは、次の2つの入力ストリームを受け入れます。

テスト・データに対して生成された予測結果。この情報は、次の3つの列で渡されます。
- ケースID列
- 予測列
- 確率が格納されているスコアリング基準列
テスト・データの既知のターゲット値。この情報は、次の2つの列で渡されます。
- ケースID列
- 既知のターゲット値が格納されているターゲット列

関連項目:

ROCおよび分類用のテスト指標値の詳細は、『Oracle Data Mining概要』を参照してください。

「COMPUTE_CONFUSION_MATRIXプロシージャ」

「COMPUTE_LIFTプロシージャ」

構文

DBMS_DATA_MINING.COMPUTE_ROC (
      roc_area_under_curve         OUT NUMBER,
      apply_result_table_name      IN  VARCHAR2,
      target_table_name            IN  VARCHAR2,
      case_id_column_name          IN  VARCHAR2,
      target_column_name           IN  VARCHAR2,
      roc_table_name               IN  VARCHAR2,
      positive_target_value        IN  VARCHAR2,
      score_column_name            IN  VARCHAR2 DEFAULT 'PREDICTION',
      score_criterion_column_name  IN  VARCHAR2 DEFAULT 'PROBABILITY',
      apply_result_schema_name     IN  VARCHAR2 DEFAULT NULL,
      target_schema_name           IN  VARCHAR2 DEFAULT NULL);

パラメータ

表38-34 COMPUTE_ROCプロシージャのパラメータ

パラメータ	説明
`roc_area_under_the_curve`	ROC曲線（AUC）の下部の面積が含まれる出力パラメータ。 AUCによって、実際の陽性が陽性として予測される可能性が測定されます。 AUCが大きいほど、ポジティブ・クラスの予測とネガティブ・クラスの予測の間のトレードオフに対応するモデルの柔軟性が高くなります。 AUCは、あるターゲット・クラスが別のターゲット・クラスと比較して、特定されるのが稀な場合または特定することがより重要な場合に、特に重要となります。
`apply_result_table_name`	予測結果が含まれる表。
`target_table_name`	テスト・データの既知のターゲット値が含まれる表。
`case_id_column_name`	適用結果表のケースID列。ターゲット表のケースIDと一致する必要があります。
`target_column_name`	ターゲット表のターゲット列。テスト・データの既知のターゲット値が格納されます。
`roc_table_name`	ROC出力が含まれる表。この表は、このプロシージャによってユーザーのスキーマ内に作成されます。 ROC表の列については、「使用上の注意」を参照してください。
`positive_target_value`	ポジティブ・クラス。 ROCの計算対象となるクラスです。ターゲット列が`NUMBER`である場合は、`TO_CHAR()`演算子を使用して数値を文字列に変換します。
`score_column_name`	適用結果表の予測結果が格納される列。デフォルトの列名は'`PREDICTION`'です。この列名は、`APPLY`プロシージャで作成されるデフォルト名です（「APPLYプロシージャ」を参照）。
`score_criterion_column_name`	適用結果表のスコアリング基準値が格納される列。予測を決定する確率が格納されます。デフォルトの列名は'`PROBABILITY`'です。この列名は、`APPLY`プロシージャで作成されるデフォルト名です（「APPLYプロシージャ」を参照）。
`apply_result_schema_name`	適用結果表のスキーマ。 NULLの場合、ユーザーのスキーマと想定されます。
`target_schema_name`	既知のターゲットが含まれている表のスキーマ。 NULLの場合、ユーザーのスキーマと想定されます。

使用上の注意

COMPUTE_ROCに渡す予測情報は、SQLファンクションPREDICTION、DBMS_DATA_MINING.APPLYプロシージャまたはその他のメカニズムを使用して生成できます。プロシージャは、渡すデータが適切な場合にかぎり、受信者操作特性を計算できます。

COMPUTE_ROCに渡す予測情報は、apply_results_table_nameで指定した表またはビューに格納されます。

CREATE TABLE apply_result_table_name AS (
            case_id_column_name            VARCHAR2,
            score_column_name              VARCHAR2,
            score_criterion_column_name    VARCHAR2);

COMPUTE_ROCで作成される表には、表38-35に示す列があります。

表38-35 COMPUTE_ROCの出力

列	データ型
`probability`	`NUMBER`
`true_positives`	`NUMBER`
`false_negatives`	`NUMBER`
`false_positives`	`NUMBER`
`true_negatives`	`NUMBER`
`true_positive_fraction`	`NUMBER`
`false_positive_fraction`	`NUMBER`

関連項目:

COMPUTE_ROCの出力の詳細は、『Oracle Data Mining概要』を参照してください。

ROCは、通常、最適な確率しきい値を決定するために使用されます。最適な確立しきい値を決定するには、真陽性率と偽陽性率を調べます。真陽性率とは、陽性であるものが、テスト・データで正しく陽性と予測される割合のことです。偽陽性率とは、陰性であるものが、テスト・データで誤って陽性と予測される割合のことです。

確率しきい値を指定すると、次の文では、適用結果表内の陽性の予測が確率順に戻されます。
```
SELECT case_id_column_name
       FROM apply_result_table_name
       WHERE probability > probability_threshold
       ORDER BY probability DESC;
```
最適な確率しきい値を特定するには、2つの方法があります。どちらの方法を採用するかは、ポジティブ・クラスとネガティブ・クラスを誤って予測した場合の相対コストがわかっているかどうかで決まります。

コストがわかっている場合は、相対コストをROC表に適用して、コストが最小になる確率しきい値を計算します。たとえば、相対コスト比率が20（ポジティブ・クラスの誤りコスト/ネガティブ・クラスの誤りコスト=20）の場合は、次のような問合せを実行します。
```
WITH cost AS (
  SELECT probability_threshold, 20 * false_negatives + false_positives cost
    FROM ROC_table
  GROUP BY probability_threshold),
    minCost AS (
      SELECT min(cost) minCost
        FROM cost)
      SELECT max(probability_threshold)probability_threshold
        FROM cost, minCost
    WHERE cost = minCost;
```
相対コストが明確にわかっていない場合は、ROC表の値を確率しきい値の昇順に並べ替えて表示し、表示されたトレードオフ（誤って分類されたポジティブ・クラスとネガティブ・クラスの比率）のうち、どのトレードオフ値が最適であるのかを判断できます。
```
SELECT * FROM ROC_table
         ORDER BY probability_threshold;
```

例

ここに示す例では、Naive Bayesモデルnb_sh_clas_sampleが使用されています。このモデルは、Oracle Data Miningのサンプル・プログラムによって作成されます。

次の文は、テスト・データにモデルを適用し、予測結果と確率を表に格納します。

CREATE TABLE nb_apply_results AS
          SELECT cust_id,
                      PREDICTION(nb_sh_clas_sample USING *) prediction,
                       PREDICTION_PROBABILITY(nb_sh_clas_sample USING *) probability
            FROM mining_data_test_v;

テスト・データの予測値とターゲット値を使用して、次のようにROCを計算できます。

DECLARE
     v_area_under_curve NUMBER;
  BEGIN
         DBMS_DATA_MINING.COMPUTE_ROC (
               roc_area_under_curve                => v_area_under_curve,
               apply_result_table_name       => 'nb_apply_results',
               target_table_name                   => 'mining_data_test_v',
               case_id_column_name                  => 'cust_id',
               target_column_name                 => 'affinity_card',
               roc_table_name                 => 'nb_roc',
               positive_target_value         => '1',
               score_column_name                   => 'PREDICTION',
               score_criterion_column_name   => 'PROBABILITY');
           DBMS_OUTPUT.PUT_LINE('**** AREA UNDER ROC CURVE ****: ' ||
           ROUND(v_area_under_curve,4));
  END;
 /

生成されるAUCおよび選択されたROC表の列は、次のように表示されます。

**** AREA UNDER ROC CURVE ****: .8212

SQL> SELECT probability, true_positive_fraction, false_positive_fraction
            FROM nb_roc;

PROBABILITY  TRUE_POSITIVE_FRACTION  FALSE_POSITIVE_FRACTION
-----------  ----------------------  -----------------------
     .00000                       1                        1
     .50018              .826589595               .227902946
     .53851              .823699422               .221837088
     .54991              .820809249               .217504333
     .55628              .815028902               .215771231
     .55628              .817919075               .215771231
     .57563              .800578035               .214904679
     .57563              .812138728               .214904679
      .                   .                        .
      .                   .                        .
      .                   .                        .

CREATE_MODELプロシージャ

このプロシージャは、特定のマイニング機能を持つマイニング・モデルを作成します。

xform_listをCREATE_MODELに渡すと、入力データで実行される変換のリストを指定できます。 PREP_AUTO設定を有効にすると、自動変換に加えてその変換が使用されます。 PREP_AUTO設定を無効にすると、指定した変換のみがモデルで実装されます。いずれの場合も、変換定義はモデルに埋め込まれ、モデルが適用されるたびに自動的に実行されます。「自動データ準備」を参照してください。

構文

DBMS_DATA_MINING.CREATE_MODEL (
      model_name            IN VARCHAR2,
      mining_function       IN VARCHAR2,
      data_table_name       IN VARCHAR2,
      case_id_column_name   IN VARCHAR2,
      target_column_name    IN VARCHAR2 DEFAULT NULL,
      settings_table_name   IN VARCHAR2 DEFAULT NULL,
      data_schema_name      IN VARCHAR2 DEFAULT NULL,
      settings_schema_name  IN VARCHAR2 DEFAULT NULL,
      xform_list            IN TRANSFORM_LIST DEFAULT NULL);

パラメータ

表38-36 CREATE_MODELプロシージャのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。「マイニング・モデルのネーミングにおける制限」も参照してください。
`mining_function`	マイニング機能。この値のリストについては、表38-2「マイニング機能」を参照してください。
`data_table_name`	作成データが含まれる表またはビュー。
`case_id_column_name`	作成データのケースID列。
`target_column_name`	監視ありモデルの場合は、作成データのターゲット列。監視なしモデルの場合は、`NULL`。
`settings_table_name`	モデルの作成設定が含まれる表。設定表がない（デフォルトの設定のみが使用されている）場合は、`NULL`。
`data_schema_name`	作成データに適用されるスキーマ。`NULL`の場合、ユーザーのスキーマと想定されます。
`settings_schema_name`	設定表に適用されるスキーマ。`NULL`の場合、ユーザーのスキーマと想定されます。
`xform_list`	自動変換に加えて、または自動変換のかわりに使用される変換のリスト。これは、`PREP_AUTO`設定の値によって異なります。（「自動データ準備」を参照）データ型は`TRANSFORM_LIST`です。これは、`TRANSFORM_REC`型のレコードで構成されます。 TYPE TRANFORM_REC IS RECORD ( attribute_name VARCHAR2(4000), attribute_subname VARCHAR2(4000), expression EXPRESSION_REC, reverse_expression EXPRESSION_REC, attribute_spec VARCHAR2(4000)); 各`TRANSFORM_REC`は、属性の変換および逆変換について説明しています。 `EXPRESSION_REC`には、SQL式が格納されます。 `EXPRESSION_REC`に格納されているSQL式は、`DBMS_DATA_MINING_TRANSFORM`パッケージのルーチンを使用して操作できます。例として、`SET_EXPRESSION`、`GET_EXPRESSION`および`SET_TRANSFORM`があります。 `ATTRIBUTE_SPEC`を使用すると、個々の属性に対して自動データ準備（ADP）を無効にできます。 ADPが有効になっている場合にこの属性が自動で準備されないようにするには、'`NOPREP`'と指定します。 ADPが無効になっている場合、値'`NOPREP`'は無視されます。ネストした属性の個々のサブ名に対しては、値'`NOPREP`'を使用できません。 ADPが有効になっている場合に個々のサブ名に対して'`NOPREP`'と指定すると、エラーが発生します。

使用上の注意

次のデータ・ディクショナリ・ビューを問い合せると、モデルに関する情報を取得できます。

ALL_MINING_MODELS
ALL_MINING_MODEL_ATTRIBUTES
ALL_MINING_MODEL_SETTINGS

ユーザー独自のスキーマのモデルに関する情報のみを取得するには、ALLのかわりにUSER接頭辞を指定します。

関連項目:

データ・ディクショナリ・ビューの詳細は、『Oracle Data Miningアプリケーション開発者ガイド』を参照してください。

例

最初の例では、サポート・ベクター・マシン・アルゴリズムを使用して分類モデルを作成します。

-- Create the settings table
CREATE TABLE svm_model_settings (
  setting_name  VARCHAR2(30),
  setting_value VARCHAR2(30));

-- Populate the settings table
-- Specify SVM. By default, Naive Bayes is used for classification.
-- Specify ADP. By default, ADP is not used.
BEGIN
  INSERT INTO svm_model_settings (setting_name, setting_value) VALUES
     (dbms_data_mining.algo_name, dbms_data_mining.algo_support_vector_machines);
  INSERT INTO svm_model_settings (setting_name, setting_value) VALUES
     (dbms_data_mining.prep_auto,dbms_data_mining.prep_auto_on);
  COMMIT;
END;
/
-- Create the model using the specified settings
BEGIN
  DBMS_DATA_MINING.CREATE_MODEL(
    model_name          => 'svm_model',
    mining_function     => dbms_data_mining.classification,
    data_table_name     => 'mining_data_build_v',
    case_id_column_name => 'cust_id',
    target_column_name  => 'affinity_card',
    settings_table_name => 'svm_model_settings');
END;
/

モデル設定は、次の問合せで表示できます。

SELECT * FROM user_mining_model_settings
       WHERE model_name IN 'SVM_MODEL';

MODEL_NAME     SETTING_NAME            SETTING_VALUE                  SETTING
-------------  ----------------------  -----------------------------  -------
SVM_MODEL      ALGO_NAME               ALGO_SUPPORT_VECTOR_MACHINES  INPUT
SVM_MODEL      SVMS_KERNEL_CACHE_SIZE  50000000                      DEFAULT
SVM_MODEL      SVMS_ACTIVE_LEARNING    SVMS_AL_ENABLE                DEFAULT
SVM_MODEL      SVMS_STD_DEV            3.004524                      DEFAULT
SVM_MODEL      PREP_AUTO               ON                            INPUT
SVM_MODEL      SVMS_COMPLEXITY_FACTOR  1.887389                      DEFAULT
SVM_MODEL      SVMS_KERNEL_FUNCTION    SVMS_GAUSSIAN                 DEFAULT
SVM_MODEL      SVMS_CONV_TOLERANCE     .001                          DEFAULT

次の例では、異常検出モデルを作成します。異常検出では、ターゲットなしでSVM分類が使用されます。この例では、最初の例でSVM分類モデル用に作成した設定表と同じ設定表を使用します。

BEGIN
  DBMS_DATA_MINING.CREATE_MODEL(
    model_name          => 'anomaly_detect_model',
    mining_function     => dbms_data_mining.classification,
    data_table_name     => 'mining_data_build_v',
    case_id_column_name => 'cust_id',
    target_column_name  => null,
    settings_table_name => 'svm_model_settings');
END;
/

この問合せは、これらの例で作成されたモデルが、スキーマで唯一のモデルであることを示しています。

SELECT model_name, mining_function, algorithm FROM user_mining_models;

MODEL_NAME              MINING_FUNCTION      ALGORITHM
----------------------  -------------------- ------------------------------
SVM_MODEL               CLASSIFICATION       SUPPORT_VECTOR_MACHINES
ANOMALY_DETECT_MODEL    CLASSIFICATION       SUPPORT_VECTOR_MACHINES

この問合せは、ターゲットがあるのはこのSVM分類モデルのみであることを示しています。

SELECT model_name, attribute_name, attribute_type, target
       FROM user_mining_model_attributes
       WHERE target = 'YES';

MODEL_NAME          ATTRIBUTE_NAME   ATTRIBUTE_TYPE     TARGET
------------------  ---------------  -----------------  ------
SVM_MODEL           AFFINITY_CARD    CATEGORICAL         YES

DROP_MODELプロシージャ

このプロシージャは、既存のマイニング・モデルを削除します。

構文

DBMS_DATA_MINING.DROP_MODEL (model_name IN VARCHAR2);

パラメータ

表38-37 DROP_MODELプロシージャのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。

使用上の注意

ただし、APPLYでモデルを使用しているときに、そのモデルを削除すると、DROP操作は成功しますが、APPLYからは不確定な結果が戻されます。

例

census_modelというモデルがあるとします。次の例は、このモデルの削除方法を示しています。

BEGIN
  DBMS_DATA_MINING.DROP_MODEL(model_name => 'census_model');
END;
/

EXPORT_MODELプロシージャ

このプロシージャは、指定されたデータ・マイニング・モデルをダンプ・ファイル・セットにエクスポートします。ダンプ・ファイル・セットからのインポートは、IMPORT_MODELプロシージャを使用して行うことができます。 IMPORT_MODELとEXPORT_MODELの両方で、Oracle Data Pumpテクノロジが使用されています。

関連項目:

モデルのエクスポートおよびインポートの詳細は、『Oracle Data Mining管理者ガイド』を参照してください。

構文

DBMS_DATA_MINING.EXPORT_MODEL (
      filename          IN VARCHAR2,
      directory         IN VARCHAR2,
      model_filter      IN VARCHAR2 DEFAULT NULL,
      filesize          IN VARCHAR2 DEFAULT NULL,
      operation         IN VARCHAR2 DEFAULT NULL,
      remote_link       IN VARCHAR2 DEFAULT NULL,
      jobname           IN VARCHAR2 DEFAULT NULL);

パラメータ

表38-38 EXPORT_MODELプロシージャのパラメータ

パラメータ	説明
`filename`	モデルのエクスポート先のダンプ・ファイル・セットの名前。この名前は、スキーマ内で一意である必要があります。ダンプ・ファイル・セットには1つ以上のファイルを保存できます。ファイルの個数は、エクスポートするモデルのサイズ（メタデータとデータの両方）および指定した（または推定された）最大ファイル・サイズによって決まります。ファイル・サイズは、`filesize`パラメータで指定できます。また、`operation`パラメータを使用して、Oracle Data Pumpでファイル・サイズを推定することもできます。エクスポートするモデルのサイズが最大ファイル・サイズより大きい場合は、1つ以上の追加ファイルが作成されます。エクスポート操作が正常に終了すると、ダンプ・ファイル・セット内にファイルが1つしか存在しない場合でも、ダンプ・ファイル・セットの名前が自動的に`filename01.dmp`という形式に拡張されます。追加ファイルがある場合は、`filename02.dmp`、`filename03.dmp`のように連続したファイル名が使用されます。
`directory`	ダンプ・ファイル・セットの作成場所を指定する、事前定義済のディレクトリ・オブジェクトの名前。このディレクトリ・オブジェクト、およびこのディレクトリ・オブジェクトによって指定されるファイル・システム・ディレクトリに対する読取り/書込み権限が必要です。
`model_filter`	エクスポートするモデルを指定するパラメータ（オプション）。 `model_filter`の値を指定しない場合は、スキーマ内のすべてのモデルがエクスポートされます。また、`NULL`（デフォルト）または`'ALL'`を指定しても、すべてのモデルをエクスポートできます。マイニング機能またはアルゴリズムに基づいて、モデルの名前およびグループ別に個々のモデルをエクスポートできます。たとえば、すべての回帰モデルまたはすべてのNaive Bayesモデルをエクスポートできます。例は、表38-39を参照してください。
`filesize`	ダンプ・ファイル・セット内のファイルの最大サイズを指定するパラメータ（オプション）。サイズは、バイト単位、キロバイト単位（KB）、メガバイト単位（MB）、ギガバイト単位（GB）で指定可能です。デフォルトのサイズは50MBです。エクスポートするモデルのサイズが`filesize`より大きい場合は、ダンプ・セット内に1つ以上の追加ファイルが作成されます。詳細は、`filename`パラメータの説明を参照してください。
`operation`	ダンプ・ファイル・セット内のファイルのサイズを推定するかどうかを指定するパラメータ（オプション）。デフォルトでは、ファイルのサイズは推定されず、`filesize`パラメータの値によって決まります。 `operation`には、次のいずれかの値を指定できます。 `'EXPORT'`: すべてのモデルまたは指定したモデルをエクスポートします（デフォルト）。 `'ESTIMATE'`: エクスポートするモデルのサイズを推定します。
`remote_link`	このリリースでは使用されないパラメータ（オプション）。`NULL`に設定します。
`jobname`	エクスポート・ジョブの名前を指定するパラメータ（オプション）。デフォルトでは、`username_exp_nnnn`という形式の名前になります（`nnnn`は数字です）。たとえば、`SCOTT`スキーマ内のジョブ名は、`SCOTT_exp_134`のようになります。ジョブ名を指定する場合は、スキーマ内で一意の名前を指定する必要があります。ジョブ名の最大長は30文字です。エクスポート・ジョブのログ・ファイルが、`jobname.log`という名前で、ダンプ・ファイル・セットと同じディレクトリに作成されます。

使用上の注意

model_filterパラメータは、エクスポートするモデルを指定します。名前別にモデルを指定したり、同じマイニング機能またはアルゴリズムを持つモデルをすべて指定できます。 USER_MINING_MODELSビューを問い合せると、スキーマ内のモデルを表示できます。

SQL> describe user_mining_models
 Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 MODEL_NAME                                NOT NULL VARCHAR2(30)
 MINING_FUNCTION                                    VARCHAR2(30)
 ALGORITHM                                          VARCHAR2(30)
 CREATION_DATE                             NOT NULL DATE
 BUILD_DURATION                                     NUMBER
 MODEL_SIZE                                         NUMBER
 COMMENTS                                           VARCHAR2(4000)

マイニング・モデルのデータ・ディクショナリ・ビューの詳細は、「マイニング・モデルのオブジェクト」を参照してください。

表38-39に、モデル・フィルタの例を示します。

表38-39 モデル・フィルタ・パラメータのサンプル値

サンプル値	意味
`'mymodel'`	`mymodel`という名前のモデルをエクスポートします。
`'name= ''mymodel'''`	`mymodel`という名前のモデルをエクスポートします。
`'name IN (''mymodel2'',''mymodel3'')'`	`mymodel2`および`mymodel3`という名前のモデルをエクスポートします。
`'ALGORITHM_NAME = ''NAIVE_BAYES'''`	すべてのNaive Bayesモデルをエクスポートします。アルゴリズム名のリストについては、表38-4を参照してください。
`'FUNCTION_NAME =''CLASSIFICATION'''`	すべての分類モデルをエクスポートします。マイニング機能のリストについては、表38-2を参照してください。

例

次の文では、DMUSER3スキーマ内のすべてのモデルが、$ORACLE_HOME/rdbms/logディレクトリのmodels_outというダンプ・ファイル・セットにエクスポートされます。このディレクトリは、DATA_PUMP_DIRというディレクトリ・オブジェクトにマップされています。DMUSER3ユーザーには、このディレクトリおよびディレクトリ・オブジェクトへの読取り/書込みアクセス権があります。

SQL>execute dbms_data_mining.export_model ('models_out', 'DATA_PUMP_DIR');

SQL*Plusを終了し、作成されたダンプ・ファイルおよびログ・ファイルを表示できます。

SQL>exit
>cd $ORACLE_HOME/rdbms/log
>ls
>DMUSER3_exp_1027.log  models_out01.dmp

次の例は、同じディレクトリ・オブジェクトを使用し、同じユーザーによって実行されます。 NMF_SH_SAMPLEというモデルおよびSVMR_SH_REGR_SAMPLEというモデルが、同じディレクトリ内の別々のダンプ・ファイル・セットにエクスポートされます。

SQL>execute dbms_data_mining.export_model ( 'models2_out', 'DATA_PUMP_DIR',
            'name in (''NMF_SH_SAMPLE'', ''SVMR_SH_REGR_SAMPLE'')');
SQL>exit
>cd $ORACLE_HOME/rdbms/log
>ls
>DMUSER3_exp_1027.log  models_out01.dmp
 DMUSER3_exp_924.log  models2_out01.dmp

GET_ASSOCIATION_RULESファンクション

このテーブル・ファンクションは、ルールを表す行の集合を相関モデルから戻します。

フィルタ条件を指定して、ルールのサブセットをGET_ASSOCIATION_RULESから戻すことができます。このテーブル・ファンクションのパフォーマンスは、フィルタ条件によって向上させることができます。ルールの数が多い場合は、topnパラメータを指定するとパフォーマンスが最適化されます。

構文

DBMS_DATA_MINING.GET_ASSOCIATION_RULES (
   model_name            IN VARCHAR2,
   topn                  IN NUMBER DEFAULT NULL,
   rule_id               IN INTEGER DEFAULT NULL,
   min_confidence        IN NUMBER DEFAULT NULL,
   min_support           IN NUMBER DEFAULT NULL,
   max_rule_length       IN INTEGER DEFAULT NULL,
   min_rule_length       IN INTEGER DEFAULT NULL,
   sort_order            IN ORA_MINING_VARCHAR2_NT DEFAULT NULL,
   antecedent_items      IN DM_ITEMS DEFAULT NULL,
   consequent_items      IN DM_ITEMS DEFAULT NULL,
   min_lift              IN NUMBER DEFAULT NULL)
 RETURN DM_RULES PIPELINED;

パラメータ

表38-40 GET_ASSOCIATION_RULESファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。これは、`GET_ASSOCIATION_RULES`の唯一の必須パラメータです。他のすべてのパラメータは、戻すルールのフィルタをオプションで設定します。
`topn`	まず信頼度、次に支持度に基づいて降順でルールを並べ、上位n個のルールを戻します。ソート順序を指定すると、そのソートの実行後に上位n個のルールが導出されます。 `topn`が指定され、ルールの最大長も最小長も指定されていない場合、ソート順序に指定できる列は`RULE_CONFIDENCE`および`RULE_SUPPORT`のみです。 topnが指定され、ルールの最大長または最小長が指定されている場合は、`RULE_CONFIDENCE`、`RULE_SUPPORT`および`NUMBER_OF_ITEMS`をソート順序に指定できます。
`rule_id`	戻すルールの識別子。 `rule_id`の値を指定する場合は、他のフィルタ・パラメータの値は指定しないでください。
`min_confidence`	この数値以上の信頼度を持つルールを戻します。
`min_support`	この数値以上の支持値を持つルールを戻します。
`max_rule_length`	この数値以下の長さを持つルールを戻します。ルールの長さとは、ルール内の項目数のことです（表38-41の「`NUMBER_OF_ITEMS`」を参照）。たとえば、ルールA=>B（AならばB）の項目の数は2です。 `max_rule_length`が指定されている場合は、ソート順序に`NUMBER_OF_ITEMS`を指定できます。
`min_rule_length`	この数値以上の長さを持つルールを戻します。ルールの長さについては、「`max_rule_length`」を参照してください。 `min_rule_length`が指定されている場合は、ソート順序に`NUMBER_OF_ITEMS`を指定できます。
`sort_order`	戻される1つ以上の列の値に基づいてルールをソートします。列名の後に`ASC`（昇順）または`DESC`（降順）を追加して、1つ以上の列名を指定します。たとえば、結果セットを、まず`NUMBER_OF_ITEMS`列に基づいて降順でソートし、次に`RULE_CONFIDENCE`列に基づいて降順でソートする場合は、次のように指定します。 `ORA_MINING_VARCHAR2_NT('NUMBER_OF_ITEMS DESC', 'RULE_CONFIDENCE DESC')` `topn`を指定した場合、結果はソート順序によって変わります。デフォルトでは、結果は、まず信頼度に基づいて降順でソートされ、次に支持度に基づいて降順でソートされます。詳細は、例を参照してください。
`antecedent_items`	これらの項目が前件にあるルールを戻します。詳細は、例を参照してください。
`consequent_items`	この項目が後件にあるルールを戻します。詳細は、例を参照してください。
`min_lift`	この数値以上のリフトを持つルールを戻します。

戻り値

表38-41 GET_ASSOCIATION RULESファンクションの戻り値

戻り値説明

DM_RULES

DM_RULE型の行の集合。この行には、次の列があります。

(rule_id              INTEGER,
 antecedent           DM_PREDICATES,
 consequent           DM_PREDICATES,
 rule_support         NUMBER,
 rule_confidence      NUMBER,
 rule_lift            NUMBER,
 antecedent_support   NUMBER,
 consequent_support   NUMBER,
 number_of_items      INTEGER )

antecedent列およびconsequent列は、それぞれDM_PREDICATES型のネストした表を戻します。その行（DM_PREDICATE型）には、次の列があります。

     (attribute_name            VARCHAR2(4000),
      attribute_subname         VARCHAR2(4000),
      conditional_operator      CHAR(2)/*=,<>,<,>,<=,>=*/,
      attribute_num_value       NUMBER,
      attribute_str_value       VARCHAR2(4000),
      attribute_support         NUMBER,
      attribute_confidence      NUMBER)

使用上の注意

このテーブル・ファンクションは、DM_RULES型の行をパイプライン出力します。データ・マイニングのデータ型およびテーブル・ファンクションからのパイプライン出力については、「データ型」を参照してください。

ORA_MINING_VARCHAR2_NT型は、VARCHAR2(4000)の表として定義されます。

例

次の例では、相関モデルを作成した後、テーブル・ファンクションGET_ASSOCIATION_RULESを数回コールしています。

-- prepare a settings table to override default settings
CREATE TABLE market_settings AS
SELECT *
  FROM TABLE(DBMS_DATA_MINING.GET_DEFAULT_SETTINGS)
 WHERE setting_name LIKE 'ASSO_%';
BEGIN
-- update the value of the minimum confidence
UPDATE census_settings
   SET setting_value = TO_CHAR(0.081)
 WHERE setting_name = DBMS_DATA_MINING.asso_min_confidence;

-- build an AR model
DBMS_DATA_MINING.CREATE_MODEL(
  model_name => 'market_model',
  function => DBMS_DATA_MINING.ASSOCIATION,
  data_table_name => 'market_build',
  case_id_column_name => 'item_id',
  target_column_name => NULL,
  settings_table_name => 'census_settings');
END;
/
-- View the (unformatted) rules
SELECT rule_id, antecedent, consequent, rule_support,
       rule_confidence
  FROM TABLE(DBMS_DATA_MINING.GET_ASSOCIATION_RULES('market_model'));

前述の例では、すべてのルールが表示されます。上位20個のルールのみを表示するには、次の文を使用します。

-- View the top 20 (unformatted) rules
SELECT rule_id, antecedent, consequent, rule_support,
       rule_confidence
  FROM TABLE(DBMS_DATA_MINING.GET_ASSOCIATION_RULES('market_model', 20));

次の例では、前件に'AQUATIC'または'EGGS'があり、後件が'VENOMOUS'であるすべてのルールが戻されます。ルールは、まずNUMBER_OF_ITEMS、次にRULE_CONFIDENCE、最後にRULE_SUPPORTに基づいて降順でソートされます。

SELECT * FROM TABLE
(    DBMS_DATA_MINING.GET_ASSOCIATION_RULES
       ('AR_Model_31', 120, NULL, 1, .51, 7,
         ORA_MINING_VARCHAR2_NT
          ('NUMBER_OF_ITEMS DESC', 'RULE_CONFIDENCE DESC', 'RULE_SUPPORT DESC'),
         ORA_MINING_VARCHAR2_NT('AQUATIC', 'EGGS'),
         ORA_MINING_VARCHAR2_NT('VENOMOUS')));

GET_DEFAULT_SETTINGSファンクション

GET_DEFAULT_SETTINGSファンクションは、11gリリース1（11.1）では非推奨になっています。このファンクションは、データ・ディクショナリ・ビュー*_MINING_MODEL_SETTINGSに置き換えられています。このビューのUSER_、ALL_およびDBA_の各バージョンを使用できます。『Oracle Data Miningアプリケーション開発者ガイド』を参照してください。

注意:

詳細は、「推奨されないサブプログラム」を参照してください。

このテーブル・ファンクションは、DBMS_DATA_MININGパッケージでサポートされるすべてのマイニング機能とマイニング・アルゴリズムのデフォルト設定を戻します。

構文

DBMS_DATA_MINING.GET_DEFAULT_SETTINGS
  RETURN DM_MODEL_SETTINGS PIPELINED;

戻り値

表38-42 GET_DEFAULT_SETTINGSファンクションの戻り値

戻り値説明

DM_MODEL_SETTINGS

DM_MODEL_SETTING型の行の集合。この行には、次の列があります。

(setting_name    VARCHAR2(30),
 setting_value   VARCHAR2(128))

使用上の注意

このテーブル・ファンクションは、DM_MODEL_SETTING型の行をパイプライン出力します。データ・マイニングのデータ型およびテーブル・ファンクションからのパイプライン出力については、「データ型」を参照してください。

特定の機能やアルゴリズムで使用される設定がわからないときに、それらの設定の全部または一部を変更する場合は、このファンクションが特に便利です。

例

たとえば、k-Meansクラスタリングのすべての設定または一部の設定を変更する場合は、次の例のような設定表を作成し、必要に応じて個々の設定を更新します。

BEGIN
  CREATE TABLE mysettings AS
  SELECT *
  FROM TABLE(DBMS_DATA_MINING.GET_DEFAULT_SETTINGS)
   WHERE setting_name LIKE 'KMNS%';
  -- now update individual settings as required
  UPDATE mysettings
     SET setting_value = 0.02
   WHERE setting_name = DBMS_DATA_MINING.KMNS_MIN_PCT_ATTR_SUPPORT;
END;
/

GET_FREQUENT_ITEMSETSファンクション

このテーブル・ファンクションは、高頻度項目セットを表す行の集合を相関モデルから戻します。高頻度項目セットの説明は、『Oracle Data Mining概要』を参照してください。

構文

DBMS_DATA_MINING.GET_FREQUENT_ITEMSETS (
    model_name          IN VARCHAR2,
    topn                IN NUMBER DEFAULT NULL,
    max_itemset_length  IN NUMBER DEFAULT NULL)
  RETURN DM_ITEMSETS PIPELINED;

パラメータ

表38-43 GET_FREQUENT_ITEMSETSファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。
`topn`	`NULL`以外の場合は、支持度に基づいて降順でルールを並べ、上位n個の行を戻します。
`max_itemset_length`	項目セットの最大長。

戻り値

表38-44 GET_FREQUENT_ITEMSETSファンクションの戻り値

戻り値説明

DM_ITEMSETS

DM_ITEMSET型の行の集合。この行には、次の列があります。

(itemsets_id      NUMBER,
items             DM_ITEMS,
support           NUMBER,
number_of_items   NUMBER)

items列は、DM_ITEMS型のネストした表を戻します。この行の型は、DM_ITEMです。

(attribute_name      VARCHAR2(4000),
attribute_subname    VARCHAR2(4000),
attribute_num_value  NUMBER,
attribute_str_value  VARCHAR2(4000))

使用上の注意

このテーブル・ファンクションは、DM_ITEMSETS型の行をパイプライン出力します。データ・マイニングのデータ型およびテーブル・ファンクションからのパイプライン出力については、「データ型」を参照してください。

例

この例では、相関モデルを作成した後、Oracle SQLからテーブル・ファンクションGET_FREQUENT_ITEMSETSをコールする方法を示します。

-- prepare a settings table to override default settings
CREATE TABLE market_settings AS

    SELECT *

  FROM TABLE(DBMS_DATA_MINING.GET_DEFAULT_SETTINGS)
 WHERE setting_name LIKE 'ASSO_%';
BEGIN
-- update the value of the minimum confidence
UPDATE market_settings
   SET setting_value = TO_CHAR(0.081)
 WHERE setting_name = DBMS_DATA_MINING.asso_min_confidence;

/* build a AR model */
DBMS_DATA_MINING.CREATE_MODEL(
  model_name           => 'market_model',
  function             => DBMS_DATA_MINING.ASSOCIATION,
  data_table_name      => 'market_build',
  case_id_column_name  => 'item_id',
  target_column_name   => NULL,
  settings_table_name  => 'census_settings');
END;
/

-- View the (unformatted) Itemsets from SQL*Plus
SELECT itemset_id, items, support, number_of_items
  FROM TABLE(DBMS_DATA_MINING.GET_FREQUENT_ITEMSETS('market_model'));

前述の例では、すべての項目セットが表示されます。上位20個の項目セットのみを表示するには、次の文を使用します。

-- View the top 20 (unformatted) Itemsets from SQL*Plus
SELECT itemset_id, items, support, number_of_items
  FROM TABLE(DBMS_DATA_MINING.GET_FREQUENT_ITEMSETS('market_model', 20));

GET_MODEL_COST_MATRIXファンクション

このファンクションは、指定したモデルに関連付けられたデフォルトのスコアリング・マトリックスの行を戻します。

デフォルトでは、このファンクションは、ADD_COST_MATRIXプロシージャを使用してモデルに追加されたスコアリング・マトリックスを戻します。モデルの作成に使用されるコスト・マトリックスを取得する場合は、matrix_typeにcost_matrix_type_createを指定します。詳細は、表38-45を参照してください。

「ADD_COST_MATRIXプロシージャ」も参照してください。

構文

DBMS_DATA_MINING.GET_MODEL_COST_MATRIX (
      model_name        IN VARCHAR2,
      matrix_type       IN VARCHAR2 DEFAULT cost_matrix_type_score)
RETURN DM_COST_MATRIX PIPELINED;

パラメータ

表38-45 GET_MODEL_COST_MATRIXファンクションのパラメータ

パラメータ説明

model_name

[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。

matrix_type

コスト・マトリックスのタイプ。

COST_MATRIX_TYPE_SCORE: スコアリングに使用されるコスト・マトリックス（デフォルト）。

COST_MATRIX_TYPE_CREATE: モデルの作成に使用されるコスト・マトリックス（ディシジョン・ツリーのみ）。

戻り値

表38-46 GET_MODEL_COST_MATRIXファンクションの戻り値

戻り値説明

DM_COST_MATRIX

DM_COST_ELEMENT型の行の集合。この行には、次の列があります。

actual          VARCHAR2(4000), predicted       VARCHAR2(4000), cost            NUMBER)

使用上の注意

コスト・マトリックスを使用して作成できるのは、ディシジョン・ツリー・モデルのみです。コスト・マトリックスを使用してディシジョン・ツリー・モデルを作成する場合、モデルの設定表のCLAS_COST_TABLE_NAME設定にコスト・マトリックス表の名前を指定します。表38-7「マイニング機能の設定」を参照してください。

ディシジョン・ツリー・モデルを作成する場合に使用するコスト・マトリックスは、そのモデルに対するデフォルトのスコアリング・マトリックスになります。スコアリング用に異なるコストを指定する場合は、コスト・マトリックス表の値を変更するか、またはREMOVE_COST_MATRIXプロシージャを使用してコスト・マトリックスを削除し、ADD_COST_MATRIXプロシージャを使用して新規コスト・マトリックスを追加できます。

例

この例では、Naive BayesモデルNB_SH_CLAS_SAMPLEに関連付けられたスコアリング・コスト・マトリックスを戻します。

column actual format a10
column predicted format a10
SELECT *
    FROM TABLE(dbms_data_mining.get_model_cost_matrix('nb_sh_clas_sample'))
    ORDER BY predicted, actual;

ACTUAL     PREDICTED   COST
---------- ---------- -----
0          0            .00
1          0            .75
0          1            .25
1          1            .00

GET_MODEL_DETAILS_ABNファンクション

Adaptive Bayes NetworkアルゴリズムおよびABNアルゴリズムは、11gリリース1（11.1）では非推奨になっています。

注意:

詳細は、「推奨されないサブプログラム」を参照してください。

このテーブル・ファンクションは、Adaptive Bayes Networkモデルのディテールを表す行の集合を戻します。

構文

DBMS_DATA_MINING.GET_MODEL_DETAILS_ABN (
    model_name         IN VARCHAR2)
  RETURN DM_ABN_DETAILS PIPELINED;

パラメータ

表38-47 GET_MODEL_DETAILS_ABNファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。

戻り値

表38-48 GET_MODEL_DETAILS_ABNファンクションの戻り値

戻り値説明

DM_ABN_DETAILS

DM_ABN_DETAIL型の行の集合。この行には、次の列があります。

(rule_id           INTEGER,
 antecedent        DM_PREDICATES,
 consequent        DM_PREDICATES,
 rule_support      NUMBER)

DM_ABN_DETAILのantecedent列およびconsequent列は、それぞれDM_PREDICATES型のネストした表を戻します。その行（DM_PREDICATE型）には、次の列があります。

     (attribute_name          VARCHAR2(4000),
      attribute_subname       VARCHAR2(4000),
      conditional_operator    CHAR(2), /*=,<>,<,>,<=,>=*/
      attribute_num_value     NUMBER,
      attribute_str_value     VARCHAR2(4000),
      attribute_support       NUMBER,
      attribute_confidence    NUMBER)

使用上の注意

このテーブル・ファンクションは、DM_ABN_DETAIL型の行をパイプライン出力します。データ・マイニングのデータ型およびテーブル・ファンクションからのパイプライン出力については、「データ型」を参照してください。

このファンクションは、単一機能ABNモデルのみのディテールを戻します。

例

この例では、ABNモデルを作成した後、Oracle SQLからテーブル・ファンクションGET_MODEL_DETAILS_ABNをコールする方法を示します。

BEGIN
  -- prepare a settings table to override default algorithm and model type
  CREATE TABLE abn_settings (setting_name VARCHAR2(30),
  setting_value
VARCHAR2(128));
  INSERT INTO abn_settings VALUES (DBMS_DATA_MINING.ALGO_NAME,
    DBMS_DATA_MINING.ALGO_ADAPTIVE_BAYES_NETWORK);
  INSERT INTO abn_settings VALUES    (DBMS_DATA_MINING.ABNS_MODEL_TYPE,     DBMS_DATA_MINING.ABNS_SINGLE_FEATURE);
   COMMIT;
  -- create a model
  DBMS_DATA_MINING.CREATE_MODEL (
    model_name           => 'abn_model',
    function             => DBMS_DATA_MINING.CLASSIFICATION,
    data_table_name      => 'abn_build',
    case_id_column_name  => 'id',
    target_column_name   => NULL,
    settings_table_name  => 'abn_settings');
END;
/
-- View the (unformatted) results from SQL*Plus
SELECT *
    FROM TABLE(DBMS_DATA_MINING.GET_MODEL_DETAILS_ABN('abn_model'));

GET_MODEL_DETAILS_AIファンクション

このテーブル・ファンクションは、属性評価モデルのディテールを表す行の集合を戻します。

構文

DBMS_DATA_MINING.GET_MODEL_DETAILS_AI (
  model_name         IN VARCHAR2)
 RETURN DM_RANKED_ATTRIBUTES PIPELINED;

パラメータ

表38-49 GET_MODEL_DETAILS_AIファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。

戻り値

表38-50 GET_MODEL_DETAILS_AIファンクションの戻り値

戻り値説明

DM_RANKED_ATTRIBUTES

DM_RANKED_ATTRIBUTE型の行の集合。この行には、次の列があります。

(attribute_name          VARCHAR2(4000,
 attribute_subname       VARCHAR2(4000),
 importance_value        NUMBER,
 rank                    NUMBER(38))

GET_MODEL_DETAILS_GLMファンクション

このテーブル・ファンクションは、一般化線形モデルの係数統計を戻します。

線形回帰とロジスティック回帰の両方に対して同じ統計セットが戻されますが、マイニング機能に適用されない統計はNULLとして戻されます。詳細は、「使用上の注意」を参照してください。

構文

DBMS_DATA_MINING.GET_MODEL_DETAILS_GLM (
             model_name             VARCHAR2)
RETURN DM_GLM_COEFF_SET PIPELINED;

パラメータ

表38-51 GET_MODEL_DETAILS_GLMファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。

戻り値

表38-52 GET_MODEL_DETAILS_GLMの戻り値

戻り値説明

DM_GLM_COEFF_SET

DM_GLM_COEFF型の行の集合。この行には、次の列があります。

(class                   VARCHAR2(4000),
 attribute_name          VARCHAR2(4000),
 attribute_subname       VARCHAR2(4000),
 attribute_value         VARCHAR2(4000),
 coefficient             NUMBER,
 std_error               NUMBER,
 test_statistic          NUMBER,
 p_value                 NUMBER,
 VIF                     NUMBER,
 std_coefficient         NUMBER,
 lower_coeff_limit       NUMBER,
 upper_coeff_limit       NUMBER,
 exp_coefficient         BINARY_DOUBLE,
 exp_lower_coeff_limit   BINARY_DOUBLE,
 exp_upper_coeff_limit   BINARY_DOUBLE)

GET_MODEL_DETAILS_GLMは、属性ごとの統計の行および切片用の追加の1行（属性名のNULL値で識別されます）を戻します。各行のデータ型は、DM_GLM_COEFFです。統計については、表38-53で説明します。

表38-53 DM_GLM_COEFFデータ型の説明

列	説明
`class`	ロジスティック回帰の非参照ターゲット・クラス。このモデルは、このクラスの確率を予測するために作成されます。その他のクラス（参照クラス）は、モデル設定`GLMS_REFERENCE_CLASS_NAME`に指定されます。詳細は、表38-11「GLMの設定」を参照してください。線形回帰の場合、`class`はNULLです。
`attribute_name`	サブ名がない場合は属性名、サブ名がある場合は属性名の最初の部分。 `attribute_name`の値は、この属性のソースであるケース表の列の名前でもあります。切片の場合、`attribute_name`はNULLです。切片は、SVMモデルのバイアスに相当する用語です。
`attribute_subname`	ネストした表の属性の名前。ネストした属性のフルネームの形式は、次のとおりです。 `attribute_name.attribute_subname` ここで、`attribute_name`は、この属性のソースであるケース表のネストした列の名前です。属性がネストしていない場合、`attribute_subname`はNULLです。属性が切片の場合、`attribute_name`と`attribute_subname`の両方がNULLです。
`attribute_value`	属性の値（質的属性のみ）。量的属性の場合、`attribute_value`はNULLです。
`coefficient`	線形係数推定値。
`std_error`	係数推定値の標準誤差。
`test_statistic`	線形回帰の場合、係数推定値のt値。ロジスティック回帰の場合、係数推定値のWaldカイ二乗値。
`p値`	`test_statistic`の確率。モデルの特定の属性の重要度を分析するのに使用されます。
`VIF`	分散拡大要因。切片の場合、この値はゼロです。ロジスティック回帰の場合、`VIF`はNULLです。
`std_coefficient`	係数の標準化推定値。
`lower_coeff_limit`	係数の信頼限界値の下限。
`upper_coeff_limit`	係数の信頼限界値の上限。
`exp_coefficient`	ロジスティック回帰の指数係数。線形回帰の場合、`exp_coefficient`はNULLです。
`exp_lower_coeff_limit`	ロジスティック回帰の場合、係数の信頼限界値の下限に対する指数係数。線形回帰の場合、`exp_lower_coeff_limit`はNULLです。
`exp_upper_coeff_limit`	ロジスティック回帰の場合、係数の信頼限界値の指数係数。線形回帰の場合、`exp_lower_coeff_limit`はNULLです。

使用上の注意

各係数に対して、必ずしもすべての統計が戻されるわけではありません。次の場合、統計はNULLになります。

マイニング機能に適用されない場合。たとえば、exp_coefficientは線形回帰には適用されません。
理論上、計算できない場合。たとえば、リッジ回帰が有効な場合、VIF（有効な場合）以外の統計を含めずに係数の値が戻されます。（リッジ回帰の詳細は、表38-11「GLMの設定」を参照してください。）
システム・リソースの制限が原因で計算できない場合。
値が無限大になる可能性がある場合。

GET_MODEL_DETAILS_GLOBALファンクション

このテーブル・ファンクションは、モデル全体に関する統計を戻します。グローバルな詳細は、GLMおよび相関ルールで使用できます。

線形回帰およびロジスティック回帰では、グローバルな詳細が別々に戻されます。リッジ回帰が有効な場合、戻されるグローバルな詳細がより少なくなります。リッジ回帰の詳細は、表38-11「GLMの設定」を参照してください。

構文

DBMS_DATA_MINING.GET_MODEL_DETAILS_GLOBAL (
      model_name     IN  VARCHAR2)
RETURN DM_MODEL_GLOBAL_DETAILS PIPELINED;

パラメータ

表38-54 GET_MODEL_DETAILS_GLOBALファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。

戻り値

表38-55 GET_MODEL_DETAILS_GLOBALファンクションの戻り値

戻り値説明

DM_MODEL_GLOBAL_DETAILS

DM_MODEL_GLOBAL_DETAIL型の行のコレクション。この行には、次の列があります。

(global_detail_name   VARCHAR2(30),
 global_detail_value   NUMBER)

GLMのグローバルな詳細: 線形回帰

表38-56 線形回帰のグローバルな詳細

GLOBAL_DETAIL_NAME	説明
`MODEL_DF`	モデルの自由度。
`MODEL_SUM_SQUARES`	モデルの平方和。
`MODEL_MEAN_SQUARE`	モデルの平均平方。
`F_VALUE`	モデルのF値の統計。
`MODEL_F_P_VALUE`	モデルのF値の確率。
`ERROR_DF`	誤差の自由度。
`ERROR_SUM_SQUARES`	誤差の平方和。
`ERROR_MEAN_SQUARE`	誤差の平均平方。
`CORRECTED_TOTAL_DF`	修正された総自由度。
`CORRECTED_TOT_SS`	修正された総平方和。
`ROOT_MEAN_SQ`	2乗平均平方根誤差。
`DEPENDENT_MEAN`	依存平均。
`COEFF_VAR`	変動係数。
`R_SQ`	R2乗。
`ADJUSTED_R_SQUARE`	調整済R2乗。
`AIC`	赤池情報量基準。
`SBIC`	Schwarzのベイズ情報量基準。
`GMSEP`	予測の推定平均平方誤差。多変量正規性を想定しています。
`HOCKING_SP`	HockingのSp統計。
`J_P`	JP統計（最終予測誤差）。
`NUM_PARAMS`	パラメータ数（切片を含む係数の数）。
`NUM_ROWS`	行数。
`MODEL_CONVERGED`	モデルが収束したかどうか。収束した場合、値は`1`です。収束しなかった場合、値は`0`です。
`VALID_COVARIANCE_MATRIX`	有効な共分散行列。共分散行列が計算された場合、値は`1`です。計算されなかった場合、値は`0`です。

GLMのグローバルな詳細: ロジスティック回帰

表38-57 ロジスティック回帰のグローバルな詳細

GLOBAL_DETAIL_NAME	説明
`AIC_INTERCEPT`	切片のみのモデルの適合度に関する赤池の基準。
`AIC_MODEL`	切片および共変量（予測子）モデルの適合度に関する赤池の基準。
`SC_INTERCEPT`	切片のみのモデルの適合度に関するSchwarzの基準。
`SC_MODEL`	切片および共変量（予測子）モデルの適合度に関するSchwarzの基準。
`NEG2_LL_INTERCEPT`	切片のみのモデルの-2対数尤度。
`NEG2_LL_MODEL`	モデルの-2対数尤度。
`LR_DF`	尤度比の自由度。
`LR_CHI_SQ`	尤度比のカイ二乗値。
`LR_CHI_SQ_P_VALUE`	尤度比のカイ二乗確率値。
`PSEUDO_R_SQ_CS`	擬似R二乗（Cox&Snell）
`PSEUDO_R_SQ_N`	擬似R二乗（Nagelkerke）
`DEPENDENT_MEAN`	依存平均。
`PCT_CORRECT`	正確な予測の割合。
`PCT_INCORRECT`	不正確に予測された行の割合。
`PCT_TIED`	両方のクラスの確率が同じケースの割合。
`NUM_PARAMS`	パラメータ数（切片を含む係数の数）。
`NUM_ROWS`	行数。
`MODEL_CONVERGED`	モデルが収束したかどうか。収束した場合、値は`1`です。収束しなかった場合、値は`0`です。
`VALID_COVARIANCE_MATRIX`	有効な共分散行列。共分散行列が計算された場合、値は`1`です。計算されなかった場合、値は`0`です。

相関ルールのグローバルな詳細

単一のグローバルな詳細は、相関モデルによって生成されます。

表38-58 相関ルールのグローバルな詳細

GLOBAL_DETAIL_NAME	説明
`RULE_COUNT`	モデル内の相関ルールの数。

GET_MODEL_DETAILS_KMファンクション

このテーブル・ファンクションは、k-Meansクラスタリング・モデルのディテールを表す行の集合を戻します。

モデルに関する特定の情報を要求するようにGET_MODEL_DETAILS_KMの入力を指定すると、問合せのパフォーマンスが向上します。フィルタ・パラメータを指定しない場合、GET_MODEL_DETAILS_KMはモデルに関するすべての情報を戻します。

構文

DBMS_DATA_MINING.GET_MODEL_DETAILS_KM (
          model_name          VARCHAR2,
          cluster_id          NUMBER    DEFAULT NULL,
          attribute           VARCHAR2  DEFAULT NULL,
          centroid            NUMBER    DEFAULT 1,
          histogram           NUMBER    DEFAULT 1,
          rules               NUMBER    DEFAULT 2,
          attribute_subname   VARCHAR2  DEFAULT NULL)
RETURN DM_CLUSTERS PIPELINED;

パラメータ

表38-59 GET_MODEL_DETAILS_KMファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。
`cluster_id`	モデル内のクラスタのID。指定したクラスタIDが有効な場合、そのクラスタのディテールのみが戻されます。そうでない場合は、すべてのクラスタのディテールが戻されます。
`attribute`	属性の名前。指定した属性名が有効な場合、その属性のディテールのみが戻されます。そうでない場合は、すべての属性のディテールが戻されます。
`centroid`	次の値を指定できます。 1 : 重心のディテールが戻されます（デフォルト）。 0 : 重心のディテールは戻されません。
`histogram`	次の値を指定できます。 1 : ヒストグラムのディテールが戻されます（デフォルト）。 0 : ヒストグラムのディテールは戻されません。
`rules`	次の値を指定できます。 2 : ルールのディテールが戻されます（デフォルト）。 1 : ルールの要約が戻されます。 0 : ルールに関する情報は戻されません。

戻り値

表38-60 GET_MODEL_DETAILS_KMファンクションの戻り値

戻り値	説明
`DM_CLUSTERS`	`DM_CLUSTER`型の行の集合。この行には、次の列があります。 (id NUMBER, cluster_id VARCHAR2(4000), record_count NUMBER, parent NUMBER, tree_level NUMBER, dispersion NUMBER, split_predicate DM_PREDICATES, child DM_CHILDREN, centroid DM_CENTROIDS, histogram DM_HISTOGRAMS, rule DM_RULE)
	`DM_CLUSTER`の`split_predicate`列は、`DM_PREDICATES`型のネストした表を戻します。各行（`DM_PREDICATE`型）には、次の列があります。 (attribute_name VARCHAR2(4000), attribute_subname VARCHAR2(4000), conditional_operator CHAR(2) /=,<>,<,>,<=,>=/, attribute_num_value NUMBER, attribute_str_value VARCHAR2(4000), attribute_support NUMBER, attribute_confidence NUMBER)
	`DM_CLUSTER`の`child`列は、`DM_CHILDREN`型のネストした表を戻します。`DM_CHILD`型の行には、`NUMBER`型の列が1つあり、その列にはそれぞれの子の識別子が含まれます。
	`DM_CLUSTER`の`centroid`列は、`DM_CENTROIDS`型のネストした表を戻します。その行（`DM_CENTROID`型）には、次の列があります。 (attribute_name VARCHAR2(4000), attribute_subname VARCHAR2(4000), mean NUMBER, mode_value VARCHAR2(4000), variance NUMBER)
	`DM_CLUSTER`の`histogram`列は、`DM_HISTOGRAMS`型のネストした表を戻します。その行（`DM_HISTOGRAM_BIN`型）には、次の列があります。 (attribute_name VARCHAR2(4000), attribute_subname VARCHAR2(4000), bin_id NUMBER, lower_bound NUMBER, upper_bound NUMBER, label VARCHAR2(4000), count NUMBER)
	`DM_CLUSTER`の`rule`列は、`DM_RULE`型の単一行を戻します。その列は次のとおりです。 (rule_id INTEGER, antecedent DM_PREDICATES, consequent DM_PREDICATES, rule_support NUMBER, rule_confidence NUMBER, rule_lift NUMBER, antecedent_support NUMBER, consequent_support NUMBER, number_of_items INTEGER)
	`DM_RULE`の`antecedent`列および`consequent`列は、それぞれ`DM_PREDICATES`型のネストした表を戻します。その行（`DM_PREDICATE`型）には、次の列があります。 (attribute_name VARCHAR2(4000), attribute_subname VARCHAR2(4000), conditional_operator CHAR(2)/=,<>,<,>,<=,>=/, attribute_num_value NUMBER, attribute_str_value VARCHAR2(4000), attribute_support NUMBER, attribute_confidence NUMBER)

使用上の注意

このテーブル・ファンクションは、DM_CLUSTERS型の行をパイプライン出力します。データ・マイニングのデータ型およびテーブル・ファンクションからのパイプライン出力については、「データ型」を参照してください。

例

この例では、k-Meansクラスタリング・モデルを作成した後、Oracle SQLからテーブル・ファンクションGET_MODEL_DETAILS_KMをコールする方法を示します。

BEGIN
-- create a settings table
UPDATE cluster_settings
   SET setting_value = 3
 WHERE setting_name = DBMS_DATA_MINING.KMEANS_BLOCK_GROWTH;

/* build a k-Means clustering model */
DBMS_DATA_MINING.CREATE_MODEL(
  model_name           => 'eight_clouds',
  function             => DBMS_DATA_MINING.CLUSTERING,
  data_table_name      => 'eight_clouds_build',
  case_id_column_name  => 'id',
  target_column_name   => NULL,
  settings_table_name  => 'cluster_settings');
END;
/

-- View the (unformatted) rules from SQL*Plus
SELECT id, record_count, parent, tree_level, dispersion,
       child, centroid, histogram, rule
  FROM TABLE(DBMS_DATA_MINING_GET_MODEL_DETAILS_KM('eight_clouds'));

GET_MODEL_DETAILS_NBファンクション

このテーブル・ファンクションは、Naive Bayesモデルのディテールを表す行の集合を戻します。

構文

DBMS_DATA_MINING.GET_MODEL_DETAILS_NB (
   model_name      IN       VARCHAR2)
 RETURN DM_NB_DETAILS PIPELINED;

パラメータ

表38-61 GET_MODEL_DETAILS_NBファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。

戻り値

表38-62 GET_MODEL_DETAILS_NBファンクションの戻り値

戻り値説明

DM_NB_DETAILS

DM_NB_DETAIL型の行の集合。この行には、次の列があります。

(target_attribute_name          VARCHAR2(30),
 target_attribute_str_value     VARCHAR2(4000),
 target_attribute_num_value     NUMBER,
 prior_probability              NUMBER,
 conditionals                   DM_CONDITIONALS)

DM_NB_DETAILのconditionals列は、DM_CONDITIONALS型のネストした表を戻します。その行（DM_CONDITIONAL型）には、次の列があります。

     (attribute_name             VARCHAR2(4000),
      attribute_subname          VARCHAR2(4000),
      attribute_str_value        VARCHAR2(4000),
      attribute_num_value        NUMBER,
      conditional_probability    NUMBER)

使用上の注意

このテーブル・ファンクションは、DM_NB_DETAILS型の行をパイプライン出力します。データ・マイニングのデータ型およびテーブル・ファンクションからのパイプライン出力については、「データ型」を参照してください。

例

この例では、Naive Bayesアルゴリズムを使用して、census_modelという分類モデルを事前に作成していると想定します。このモデルのディテールを取り出すには、次のように入力します。

-- You can view the Naive Bayes model details in many ways
-- Consult the Oracle Application Developer's Guide -
-- Object-Relational Features for different ways of
-- accessing Oracle Objects.

-- View the (unformatted) details from SQL*Plus
SELECT attribute_name, attribute_num_value, attribute_str_value,
       prior_probability, conditionals,
  FROM TABLE(DBMS_DATA_MINING.GET_MODEL_DETAILS_NB('census_model');

書式化のルールは、nbdemo.sqlを参照してください。

GET_MODEL_DETAILS_NMFファンクション

このテーブル・ファンクションは、Non-Negative Matrix Factorizationモデルのディテールを表す行の集合を戻します。

構文

DBMS_DATA_MINING.GET_MODEL_DETAILS_NMF (
   model_name        IN        VARCHAR2)
 RETURN DM_NMF_FEATURE_SET PIPELINED;

パラメータ

表38-63 GET_MODEL_DETAILS_NMFファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。

戻り値

表38-64 GET_MODEL_DETAILS_NMFファンクションの戻り値

戻り値説明

DM_NMF_FEATURE_SET

DM_NMF_FEATURE型の行の集合。この行には、次の列があります。

(feature_id          NUMBER,
 mapped_feature_id   VARCHAR2(4000),
 attribute_set       DM_NMF_ATTRIBUTE_SET)

DM_NMF_FEATUREのattribute_set列は、DM_NMF_ATTRIBUTE_SET型のネストした表を戻します。その行（DM_NMF_ATTRIBUTE型）には、次の列があります。

     (attribute_name    VARCHAR2(4000),
      attribute_subname  VARCHAR2(4000),
      attribute_value    VARCHAR2(4000),
      coefficient        NUMBER)

使用上の注意

このテーブル・ファンクションは、DM_NMF_FEATURE_SET型の行をパイプライン出力します。データ・マイニングのデータ型およびテーブル・ファンクションからのパイプライン出力については、「データ型」を参照してください。

例

この例では、my_nmf_modelというNMFモデルを事前に作成していると想定します。このモデルのディテールを取り出すには、次のように入力します。

--View (unformatted) details from SQL*Plus
SELECT feature_id, attribute_set
FROM TABLE(DBMS_DATA_MINING.GET_MODEL_DETAILS_NMF(
        'my_nmf_model'));

GET_MODEL_DETAILS_OCファンクション

このテーブル・ファンクションは、O-Clusterクラスタリング・モデルのディテールを表す行の集合を戻します。戻り値の行集合は、モデルの作成時に生成されたクラスタリング・パターンを列挙しています。

モデルに関する特定の情報を要求するようにGET_MODEL_DETAILS_OCの入力を指定すると、問合せのパフォーマンスが向上します。フィルタ・パラメータを指定しない場合、GET_MODEL_DETAILS_OCはモデルに関するすべての情報を戻します。

構文

DBMS_DATA_MINING.GET_MODEL_DETAILS_OC (
          model_name         VARCHAR2,
          cluster_id         NUMBER    DEFAULT NULL,
          attribute          VARCHAR2  DEFAULT NULL,
          centroid           NUMBER    DEFAULT 1,
          histogram          NUMBER    DEFAULT 1,
          rules              NUMBER    DEFAULT 2)
RETURN DM_CLUSTERS PIPELINED;

パラメータ

表38-65 GET_MODEL_DETAILS_OCファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。
`cluster_id`	モデル内のクラスタのID。指定したクラスタIDが有効な場合、そのクラスタのディテールのみが戻されます。そうでない場合は、すべてのクラスタのディテールが戻されます。
`attribute`	属性の名前。指定した属性名が有効な場合、その属性のディテールのみが戻されます。そうでない場合は、すべての属性のディテールが戻されます。
`centroid`	次の値を指定できます。 1 : 重心のディテールが戻されます（デフォルト）。 0 : 重心のディテールは戻されません。
`histogram`	次の値を指定できます。 1 : ヒストグラムのディテールが戻されます（デフォルト）。 0 : ヒストグラムのディテールは戻されません。
`rules`	次の値を指定できます。 2 : ルールのディテールが戻されます（デフォルト）。 1 : ルールの要約が戻されます。 0 : ルールに関する情報は戻されません。

戻り値

表38-66 GET_MODEL_DETAILS_OCファンクションの戻り値

戻り値	説明
`DM_CLUSTERS`	`DM_CLUSTER`型の行の集合。この行には、次の列があります。 (id NUMBER, cluster_id VARCHAR2(4000), record_count NUMBER, parent NUMBER, tree_level NUMBER, dispersion NUMBER, split_predicate DM_PREDICATES, child DM_CHILDREN, centroid DM_CENTROIDS, histogram DM_HISTOGRAMS, rule DM_RULE)
	`DM_CLUSTER`の`split_predicate`列は、`DM_PREDICATES`型のネストした表を戻します。各行（`DM_PREDICATE`型）には、次の列があります。 (attribute_name VARCHAR2(4000), attribute_subname VARCHAR2(4000), conditional_operator CHAR(2) /=,<>,<,>,<=,>=/, attribute_num_value NUMBER, attribute_str_value VARCHAR2(4000), attribute_support NUMBER, attribute_confidence NUMBER)
	`DM_CLUSTER`の`child`列は、`DM_CHILDREN`型のネストした表を戻します。`DM_CHILD`型の行には、`NUMBER`型の列が1つあり、その列にはそれぞれの子の識別子が含まれます。
	`DM_CLUSTER`の`centroid`列は、`DM_CENTROIDS`型のネストした表を戻します。その行（`DM_CENTROID`型）には、次の列があります。 (attribute_name VARCHAR2(4000), attribute_subname VARCHAR2(4000), mean NUMBER, mode_value VARCHAR2(4000), variance NUMBER)
	`DM_CLUSTER`の`histogram`列は、`DM_HISTOGRAMS`型のネストした表を戻します。その行（`DM_HISTOGRAM_BIN`型）には、次の列があります。 (attribute_name VARCHAR2(4000), attribute_subname VARCHAR2(4000), bin_id NUMBER, lower_bound NUMBER, upper_bound NUMBER, label VARCHAR2(4000), count NUMBER)
	`DM_CLUSTER`の`rule`列は、`DM_RULE`型の単一行を戻します。その列は次のとおりです。 (rule_id INTEGER, antecedent DM_PREDICATES, consequent DM_PREDICATES, rule_support NUMBER, rule_confidence NUMBER, rule_lift NUMBER, antecedent_support NUMBER, consequent_support NUMBER, number_of_items INTEGER)
	`antecedent`列および`consequent`列は、それぞれ`DM_PREDICATES`型のネストした表を戻します。その行（`DM_PREDICATE`型）には、次の列があります。 (attribute_name VARCHAR2(4000), attribute_subname VARCHAR2(4000), conditional_operator CHAR(2)/=,<>,<,>,<=,>=/, attribute_num_value NUMBER, attribute_str_value VARCHAR2(4000), attribute_support NUMBER, attribute_confidence NUMBER)

使用上の注意

このテーブル・ファンクションは、DM_CLUSTER型の行をパイプライン出力します。データ・マイニングのデータ型およびテーブル・ファンクションからのパイプライン出力については、「データ型」を参照してください。

例

この例では、my_oc_modelというOCモデルを事前に作成していると想定します。このモデルのディテールから情報を取り出すには、次のように入力します。

--View (unformatted) details from SQL*Plus
SELECT T.id           clu_id,
       T.record_count rec_cnt,
       T.parent       parent,
       T.tree_level   tree_level
  FROM (SELECT *
          FROM TABLE(DBMS_DATA_MINING.GET_MODEL_DETAILS_OC(
                 'my_oc_model'))
        ORDER BY id) T
 WHERE ROWNUM < 11;

GET_MODEL_DETAILS_SVMファンクション

このテーブル・ファンクションは、サポート・ベクター・マシン・モデルのディテールを表す行の集合を戻します。このテーブル・ファンクションを適用できるのは、線形カーネルを使用して作成された分類モデルまたは回帰モデルに限られます。その他のカーネルについては、ORA-40215が戻されます。

線形SVMモデルでは、ゼロ以外の係数のみが格納されます。これにより記憶域が削減され、モデルをロードする速度が上がります。その結果、GET_MODEL_DETAILS_SVMで戻される係数のリストに属性がない場合、この属性の係数はゼロとして解釈されます。

構文

DBMS_DATA_MINING.GET_MODEL_DETAILS_SVM (
  model_name      IN       VARCHAR2)
 RETURN DM_SVM_LINEAR_COEFF_SET PIPELINED;

パラメータ

表38-67 GET_MODEL_DETAILS_SVMファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。

戻り値

表38-68 GET_MODEL_DETAILS_SVMファンクションの戻り値

戻り値説明

DM_SVM_LINEAR_COEFF_SET

DM_SVM_LINEAR_COEFF型の行の集合。この行には、次の列があります。

(class            VARCHAR2(4000),
 attribute_set    DM_SVM_ATTRIBUTE_SET)

attribute_set列は、DM_SVM_ATTRIBUTE_SET型のネストした表を戻します。その行（DM_SVM_ATTRIBUTE型）には、次の列があります。

     (attribute_name      VARCHAR2(4000),
      attribute_subname   VARCHAR2(4000),
      attribute_value     VARCHAR2(4000),
      coefficient         NUMBER)

詳細は、「使用上の注意」を参照してください。

使用上の注意

このテーブル・ファンクションは、DM_SVM_LINEAR_COEFF型の行をパイプライン出力します。データ・マイニングのデータ型およびテーブル・ファンクションからのパイプライン出力については、「データ型」を参照してください。

DM_SVM_LINEAR_COEFFのclass列は分類ターゲット値を表します。回帰のターゲットの場合、classはNULLです。分類モデルの個々の分類ターゲット値の場合は、係数の集合が戻されます。バイナリ分類モデル、1クラス分類子モデルおよび回帰モデルの場合は、係数の単一集合のみが戻されます。

ネストした表DM_SVM_ATTRIBUTE_SETのattribute_value列は、質的属性で使用されます。coefficient列は、線形係数の値です。

例

この例では、SVMモデルを作成した後、Oracle SQLからテーブル・ファンクションGET_MODEL_DETAILS_SVMをコールする方法を示します。

 -- Create SVM model
BEGIN
  dbms_data_mining.create_model(
    model_name           => 'SVM_Clas_sample',
    mining_function      => dbms_data_mining.classification,
    data_table_name      => 'svmc_sample_build_prepared',
    case_id_column_name  => 'id',
    target_column_name   => 'affinity_card',
    settings_table_name  => 'svmc_sample_settings');
END;
/
-- Display model details
SELECT *
  FROM TABLE(DBMS_DATA_MINING.GET_MODEL_DETAILS_SVM('SVM_Clas_sample'))
ORDER BY class;

GET_MODEL_DETAILS_XMLファンクション

このテーブル・ファンクションは、ディシジョン・ツリー・モデルのディテールを示すXMLオブジェクトを戻します。

構文

DBMS_DATA_MINING.GET_MODEL_DETAILS_XML (
         model_name      IN       VARCHAR2)
   RETURN XMLTYPE;

パラメータ

表38-69 GET_MODEL_DETAILS_XMLファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。

戻り値

表38-70 GET_MODEL_DETAILS_XMLファンクションの戻り値

戻り値	説明
`XMLTYPE`	ディシジョン・ツリー・モデルのPMML 2.1 XML定義。

使用上の注意

このファンクションは、ディシジョン・ツリーを表すXMLを戻します。この定義は、Data Mining Group Predictive Model Markup Language（PMML）バージョン2.1の仕様で規定されている定義です。この仕様については、http://www.dmg.orgを参照してください。

GET_MODEL_SETTINGSファンクション

GET_MODEL_SETTINGSファンクションは、11gリリース1（11.1）では非推奨になっています。このファンクションは、データ・ディクショナリ・ビュー*_MINING_MODEL_SETTINGSに置き換えられています。このビューのUSER_、ALL_およびDBA_の各バージョンを使用できます。『Oracle Data Miningアプリケーション開発者ガイド』を参照してください。

注意:

詳細は、「推奨されないサブプログラム」を参照してください。

このテーブル・ファンクションは、モデルの作成に使用された設定のリストを戻します。

構文

DBMS_DATA_MINING.GET_MODEL_SETTINGS(
   model_name           IN VARCHAR2)
 RETURN DM_MODEL_SETTINGS PIPELINED;

パラメータ

表38-71 GET_MODEL_SETTINGSファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。

戻り値

表38-72 GET_MODEL_SETTINGSファンクションの戻り値

戻り値説明

DM_MODEL_SETTINGS

DM_MODEL_SETTING型の行の集合。この行には、次の列があります。

(setting_name    VARCHAR2(30),
setting_value    VARCHAR2(128))

使用上の注意

このテーブル・ファンクションは、DM_MODEL_SETTING型の行をパイプライン出力します。データ・マイニングのデータ型およびテーブル・ファンクションからのパイプライン出力については、「データ型」を参照してください。

このテーブル・ファンクションを使用すると、モデルの作成に使用された設定を確認できます。このファンクションの目的は情報の参照に限られています。モデルの設定は変更できません。

例

この例では、Naive Bayesアルゴリズムを使用して、census_modelという分類モデルを事前に作成していると想定します。Oracle SQLを使用してこのモデルの設定を参照するには、次の文を実行します。

SELECT setting_name, setting_value
  FROM TABLE(DBMS_DATA_MINING.GET_MODEL_SETTINGS('census_model'));

GET_MODEL_SIGNATUREファンクション

GET_MODEL_SIGNATUREファンクションは、11gリリース1（11.1）では非推奨になっています。このファンクションは、データ・ディクショナリ・ビュー*_MINING_MODEL_ATTRIBUTESに置き換えられています。このビューのUSER_、ALL_およびDBA_の各バージョンを使用できます。『Oracle Data Miningアプリケーション開発者ガイド』を参照してください。

注意:

詳細は、「推奨されないサブプログラム」を参照してください。

このテーブル・ファンクションはモデルのシグネチャを戻します。これは、モデルの作成に使用され、スコアリング・データに存在する必要がある列属性を表示します。

ケースIDはマイニング属性とみなされません。分類モデルと回帰モデルでは、ターゲット属性もモデルのシグネチャに入りません。

関連項目:

GET_MODEL_SIGNATUREファンクションを使用するかわりに、データ・ディクショナリ・ビューALL_MINING_MODEL_ATTRIBUTESを問い合せることができます。『Oracle Data Miningアプリケーション開発者ガイド』を参照してください。

構文

DBMS_DATA_MINING.GET_MODEL_SIGNATURE(
  model_name           IN VARCHAR2)
RETURN DM_MODEL_SIGNATURE PIPELINED;

パラメータ

表38-73 GET_MODEL_SIGNATUREファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。

戻り値

表38-74 GET_MODEL_SIGNATUREファンクションの戻り値

戻り値説明

DM_MODEL_SIGNATURE

DM_MODEL_SIGNATURE_ATTRIBUTE型の行の集合。この行には、次の列があります。

(attribute_name      VARCHAR2(30),
 attribute_type      VARCHAR2(106))

使用上の注意

このテーブル・ファンクションは、DM_MODEL_SIGNATURE型の行をパイプライン出力します。データ・マイニングのデータ型およびテーブル・ファンクションからのパイプライン出力については、「データ型」を参照してください。

例

この例では、Naive Bayesアルゴリズムを使用して、census_modelという分類モデルを事前に作成していると想定します。Oracle SQLを使用してこのモデルのシグネチャを参照するには、次の文を実行します。

SELECT attribute_name, attribute_type
  FROM TABLE(DBMS_DATA_MINING.GET_MODEL_SIGNATURE('census_model');

GET_MODEL_TRANSFORMATIONSファンクション

このファンクションは、モデルに関連付けられた変換定義を戻します。

データは変換され、変換定義はモデルのトレーニング（作成）プロセス中にモデルに埋め込まれます。変換は自動的に生成されるか、またはユーザーが定義できます（あるいはその両方）。

関連項目:

「CREATE_MODELプロシージャ」および「自動データ準備」

構文

DBMS_DATA_MINING.GET_MODEL_TRANSFORMATIONS (
      model_name     IN VARCHAR2)
RETURN DM_TRANSFORMS PIPELINED;

パラメータ

表38-75 GET_MODEL_TRANSFORMATIONSファンクションのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。

戻り値

表38-76 GET_MODEL_TRANSFORMATIONSファンクションの戻り値

戻り値説明

DM_TRANSFORMS

DM_TRANSFORM型の行の集合。この行には、次の列があります。

(attribute_name       VARCHAR2(4000),
 attribute_subname    VARCHAR2(4000),
 expression           CLOB,
 reverse_expression   CLOB)

GET_MODEL_TRANSFORMATIONSでは、変換定義に加えて、逆変換定義が戻されます。逆変換は、GET_MODEL_DETAILSファンクションによって戻されるモデル属性に適用されます。また、予測モデルが適用されるときに、ターゲットにも適用されます。逆変換を使用すると、モデルの透過性が有効になります。つまり、モデルによって生成された属性情報が、可能なかぎり元の未変換の状態になります。

GET_TRANSFORM_LISTプロシージャ

このファンクションは、変換の仕様をDM_TRANSFORMS型からTRANSFORM_LIST型に変換するために使用されます。

DM_TRANSFORMSは、GET_MODEL_TRANSFORMATIONSファンクションから戻されるモデルの変換を出力するために使用されます。

DBMS_DATA_MINING_TRANSFORMパッケージのCREATE_MODELおよびファンクションでは、TRANSFORM_LISTを使用できます。これらをGET_MODEL_TANSFORMATIONSの出力で使用するには、最初にGET_TRANSFORM_LISTを呼び出してTRANSFORM_LIST型に変換する必要があります。

構文

DBMS_DATA_MINING.GET_TRANSFORM_LIST (
      xform_list           OUT NOCOPY TRANSFORM_LIST,
      model_xforms         IN  DM_TRANSFORMS);

パラメータ

表38-77 GET_TRANSFORM_LISTプロシージャのパラメータ

パラメータ	説明
`xform_list`	`model_xform`から`TRANSFORM_LIST`に変換された変換の仕様。
`model_xforms`	`GET_MODEL_TRANSFORMATIONS`によって戻される変換の仕様。

IMPORT_MODELプロシージャ

このプロシージャは、EXPORT_MODELまたはexpdpエクスポート・ユーティリティによって作成されたダンプ・ファイル・セットから、指定されたデータ・マイニング・モデルをインポートします。 IMPORT_MODELとEXPORT_MODELの両方で、Oracle Data Pumpテクノロジが使用されています。

関連項目:

モデルのエクスポートおよびインポートの詳細は、『Oracle Data Mining管理者ガイド』を参照してください。

構文

DBMS_DATA_MINING.IMPORT_MODEL (
    filename             IN  VARCHAR2,
    directory            IN  VARCHAR2,
    model_filter         IN  VARCHAR2 DEFAULT NULL,
    operation            IN  VARCHAR2 DEFAULT NULL,
    remote_link          IN  VARCHAR2 DEFAULT NULL,
    jobname              IN  VARCHAR2 DEFAULT NULL,
    schema_remap         IN  VARCHAR2 DEFAULT NULL);

パラメータ

表38-78 IMPORT_MODELプロシージャのパラメータ

パラメータ	説明
`filename`	モデルのインポート元のダンプ・ファイル・セットの名前。ダンプ・ファイル・セットは、`EXPORT_MODEL`プロシージャまたはOracle Data Pumpの`expdp`エクスポート・ユーティリティで作成されている必要があります。ダンプ・ファイル・セットには1つ以上のファイルを保存できます。（詳細は、「EXPORT_MODELプロシージャ」を参照。）ダンプ・ファイル・セット内に複数のダンプ・ファイルが存在する場合は、ファイルを列挙するかわりに`'filename%U'`を指定できます。たとえば、ダンプ・ファイル・セット内に`archive01.dmp`、`archive02.dmp`、`archive03.dmp`という3つのダンプ・ファイルが存在する場合は、`'archive%U'`と指定してそれらのファイルをインポートできます。
`directory`	ダンプ・ファイル・セットの場所を指定する、事前定義済のディレクトリ・オブジェクトの名前。このディレクトリ・オブジェクト、およびこのディレクトリ・オブジェクトによって指定されるファイル・システム・ディレクトリに対する読取り/書込み権限が必要です。
`model_filter`	インポートする1つ以上のモデルを指定するパラメータ。 `model_filter`の値を指定しない場合は、ダンプ・ファイル・セット内のすべてのモデルがインポートされます。また、`NULL`（デフォルト）または'ALL'を指定しても、すべてのモデルをインポートできます。 `model_filter`の値には、1つ以上のモデル名を指定できます。有効なフィルタは次のとおりです。 'mymodel1' 'name IN (''mymodel2'',''mymodel3'')' 1行目では、`IMPORT_MODEL`によって`mymodel1`という名前の1つのモデルがインポートされます。 2行目では、`IMPORT_MODEL`によって2つのモデル（`mymodel2`および`mymodel3`）がインポートされます。
`operation`	モデルをインポートするか、モデルを作成するSQL文をインポートするかを指定するパラメータ（オプション）。デフォルトでは、モデルがインポートされます。 `operation`には、次のいずれかの値を指定できます。 `'IMPORT'`: モデルをインポートします（デフォルト）。 `'SQL_FILE'`: モデルを作成するSQL DDLをテキスト・ファイルに書き出します。テキスト・ファイルは、`job_name.sql`という名前が付けられ、ダンプ・セット・ディレクトリに保存されます。
`remote_link`	このリリースでは使用されないパラメータ（オプション）。`NULL`に設定します。
`jobname`	インポート・ジョブの名前を指定するパラメータ（オプション）。デフォルトでは、`username_imp_nnnn`という形式の名前になります（`nnnn`は数字です）。たとえば、`SCOTT`スキーマ内のジョブ名は、`SCOTT_imp_134`のようになります。ジョブ名を指定する場合は、スキーマ内で一意の名前を指定する必要があります。ジョブ名の最大長は30文字です。インポート・ジョブのログ・ファイルが、`jobname.log`という名前で、ダンプ・ファイル・セットと同じディレクトリに作成されます。
`schema_remap`	別のスキーマにインポートするためのパラメータ（オプション）。デフォルトでは、モデルのエクスポートとインポートは同じスキーマ内で行われます。ダンプ・ファイル・セットが別のスキーマに属している場合は、`export_user`:`import_user`の形式でスキーマ・マッピングを指定する必要があります。たとえば、`SCOTT`によって`MARY`スキーマにエクスポートされたモデルをインポートする場合は、`'SCOTT:MARY'`と指定します。注意: 別のスキーマからモデルをインポートする際に、`IMPORT_FULL_DATABASE`権限または`SYS`ロールが必要な場合があります。

例

この例では、dmuser2スキーマ内でモデルのエクスポートとインポートを行っています。次に、同じモデルをdmuser3スキーマにインポートしています。 dmuser3ユーザーには、IMPORT_FULL_DATABASE権限があります。

SQL> connect dmuser2
Enter password: dmuser2_password
Connected.
SQL> select model_name from user_mining_models;

MODEL_NAME
------------------------------
NMF_SH_SAMPLE
SVMO_SH_CLAS_SAMPLE
SVMR_SH_REGR_SAMPLE

-- export the model called NMF_SH_SAMPLE to a dump file in same schema
SQL>EXECUTE DBMS_DATA_MINING.EXPORT_MODEL ('NMF_SH_SAMPLE_out', 'DATA_PUMP_DIR',
                            'name = ''NMF_SH_SAMPLE''');
-- import the model back into the same schema
SQL>EXECUTE DBMS_DATA_MINING.IMPORT_MODEL ('NMF_SH_SAMPLE_out01.dmp',
                            'DATA_PUMP_DIR', 'name = ''NMF_SH_SAMPLE''');

-- connect as different user
-- import same model into that schema
SQL> connect dmuser3
Enter password: dmuser3_password
Connected.
SQL>EXECUTE DBMS_DATA_MINING.IMPORT_MODEL ('NMF_SH_SAMPLE_out01.dmp',
                            'DATA_PUMP_DIR', 'name = ''NMF_SH_SAMPLE''',
                            'IMPORT', NULL, 'nmf_imp_job', 'dmuser2:dmuser3');

この例では、ユーザーSCOTTが作成したダンプ・ファイルmodel_exp_001.dmpから、ユーザーMARYがすべてのモデルをインポートします。ダンプ・ファイルは、DM_DUMPというディレクトリ・オブジェクトにマップされたファイル・システム・ディレクトリに保存されています。ユーザーMARYがIMPORT_FULL_DATABASE権限を持っていない場合は、IMPORT_MODELからエラーが戻されます。

-- import all models
DECLARE
  file_name       VARCHAR2(40);
BEGIN
  file_name := 'model_exp_001.dmp';
  DBMS_DATA_MINING.IMPORT_MODEL(
                filename=>file_name,
               directory=>'DM_DUMP',                 schema_remap=>'SCOTT:MARY');
  DBMS_OUTPUT.PUT_LINE(
'DBMS_DATA_MINING.IMPORT_MODEL of all models from SCOTT done!');
END;
/

RANK_APPLYプロシージャ

このプロシージャは、予測モデルまたは記述モデルをデータに適用した結果（APPLY結果）を上位N番までのフィルタに基づいてランク付けします。分類モデルの場合は、このプロシージャへの入力パラメータとしてコスト・マトリックスを指定すると、予測のコストを反映したランク付けされた結果が得られます。

構文

DBMS_DATA_MINING.RANK_APPLY (
      apply_result_table_name        IN VARCHAR2,
      case_id_column_name            IN VARCHAR2,
      score_column_name              IN VARCHAR2,
      score_criterion_column_name    IN VARCHAR2,
      ranked_apply_table_name        IN VARCHAR2,
      top_N                          IN INTEGER DEFAULT 1,
      cost_matrix_table_name         IN VARCHAR2 DEFAULT NULL,
      apply_result_schema_name       IN VARCHAR2 DEFAULT NULL,
      cost_matrix_schema_name        IN VARCHAR2 DEFAULT NULL);

パラメータ

表38-79 RANK_APPLYプロシージャのパラメータ

パラメータ	説明
`apply_result_table_name`	テスト・データセットに対する`APPLY`操作の結果を保存した表またはビューの名前（「使用上の注意」を参照）。
`case_id_column_name`	ケースID列の名前。この名前は適用（`APPLY`）結果の作成時に使用したケースID列の名前と一致する必要があります。
`score_column_name`	適用結果表の予測列の名前。
`score_criterion_column_name`	適用結果表の確率列の名前。
`ranked_apply_result_tab_name`	ランク付けされた適用結果が保存される表の名前。
`top_N`	上位N番までが、精密なリコール計算の`APPLY`結果によって予測されます。
`cost_matrix_table_name`	コスト・マトリックス表の名前。
`apply_result_schema_name`	`APPLY`の適用結果表に適用されるスキーマの名前。
`cost_matrix_schema_name`	コスト・マトリックス表に適用されるスキーマの名前。

使用上の注意

RANK_APPLYを使用すると、上位N番までのフィルタに基づいてランク付けされた適用結果を作成できます。また、モデルがコスト付きで作成されている場合は、予測のコストを反映した結果が得られます。

CREATE_MODEL、DROP_MODEL、RENAME_MODELなどの他のDDL操作の観点から見ると、RANK_APPLYの動作はAPPLYの動作と似ています。このプロシージャの基本動作は、モデル型には依存しません。重要な入力パラメータは、APPLYによって固定スキーマ表に出力される適用結果です。

RANK_APPLYの主な使用目的は、本番環境においてモデルをスコアリング・データに適用（APPLY）して、最終的な適用結果を作成することです。 APPLYを使用してテスト・データにモデルを適用し、様々なコスト・マトリックス表に対するテスト指標値を計算した後、最適なコスト・マトリックスをRANK_APPLYへの入力として指定できます。

以降の項では、サポートされる個々のアルゴリズムにおいて、適用結果が保存される表のスキーマを示します。 case_id列の値は、適用結果のケースID列と同じ値になります。

分類モデル: NB、ABN、SVM

量的ターゲットの場合、ランク付けされた適用結果は次の定義を持つ表に保存されます。

(case_id       VARCHAR2/NUMBER,
prediction     NUMBER,
probability    NUMBER,
cost           NUMBER,
rank           INTEGER)

質的ターゲットの場合、ランク付けされた適用結果は次の定義を持つ表に保存されます。

(case_id       VARCHAR2/NUMBER,
prediction     VARCHAR2,
probability    NUMBER,
cost           NUMBER,
rank           INTEGER)

k-MeansまたはO-Clusterを使用するクラスタリング

クラスタリングは監視なしのマイニング機能であるため、ターゲットは存在しません。APPLY操作の結果は、単にケースに対応するクラスタ識別子と、ケースの確率のみになります。コスト・マトリックスは考慮されません。ランク付けされた適用結果は次の定義を持つ表に保存されます。この表のクラスタ識別子はtop-Nによってランク付けされます。

(case_id       VARCHAR2/NUMBER,
cluster_id     NUMBER,
probability    NUMBER,
rank           INTEGER)

NMFを使用する特徴抽出

特徴抽出も監視なしのマイニング機能であるため、ターゲットは存在しません。APPLY操作の結果は、単にケースに対応する機能識別子と、ケースの一致率のみになります。コスト・マトリックスは考慮されません。ランク付けされた適用結果は次の定義を持つ表に保存されます。この表の機能識別子はtop-Nによってランク付けされます。

(case_id        VARCHAR2/NUMBER,
feature_id      NUMBER,
match_quality   NUMBER,
rank            INTEGER)

例

BEGIN
/* build a model with name census_model.
 * (See example under CREATE_MODEL)
 */

/* if training data was pre-processed in any manner,
 * perform the same pre-processing steps on apply
 * data also.
 * (See examples in the section on DBMS_DATA_MINING_TRANSFORM)
 */

/* apply the model to data to be scored */
DBMS_DATA_MINING.RANK_APPLY(
  apply_result_table_name       => 'census_apply_result',
  case_id_column_name           => 'person_id',
  score_column_name             => 'prediction',
  score_criterion_column_name   => 'probability
  ranked_apply_result_tab_name  => 'census_ranked_apply_result',
  top_N                         => 3,
  cost_matrix_table_name        => 'census_cost_matrix');
END;
/

-- View Ranked Apply Results
SELECT *
  FROM census_ranked_apply_result;

REMOVE_COST_MATRIXプロシージャ

分類モデルからデフォルトのスコアリング・マトリックスを削除します。

関連項目:

「ADD_COST_MATRIXプロシージャ」を参照してください。
「REMOVE_COST_MATRIXプロシージャ」を参照してください。

構文

DBMS_DATA_MINING.REMOVE_COST_MATRIX (
      model_name   IN  VARCHAR2);

パラメータ

表38-80 Remove_Cost_Matrixプロシージャのパラメータ

パラメータ	説明
`model_name`	[schema_name.]model_nameの形式のモデル名。スキーマを指定しない場合は、独自のスキーマが使用されます。

使用上の注意

モデルがスキーマにない場合、REMOVE_COST_MATRIXでは、ALTER ANY MINING MODELシステム権限またはそのマイニング・モデルに対するALTERオブジェクト権限が必要です。

例

Naive BayesモデルNB_SH_CLAS_SAMPLEには、モデルのスコアリングに使用できるコスト・マトリックスが関連付けられています。

SQL>SELECT *
      FROM TABLE(dbms_data_mining.get_model_cost_matrix('nb_sh_clas_sample'))
      ORDER BY predicted, actual;

ACTUAL     PREDICTED        COST
---------- ---------- ----------
0          0                   0
1          0                 .75
0          1                 .25
1          1                   0

REMOVE_COST_MATRIXを使用すると、コスト・マトリックスを削除できます。

SQL>EXECUTE dbms_data_mining.remove_cost_matrix('nb_sh_clas_sample');

SQL>SELECT *
      FROM TABLE(dbms_data_mining.get_model_cost_matrix('nb_sh_clas_sample'))
      ORDER BY predicted, actual;

no rows selected

RENAME_MODELプロシージャ

このプロシージャは、マイニング・モデルの名前を、指定した新しい名前に変更します。

モデル名は、[schema_name.]model_nameの形式です。スキーマを指定しない場合は、独自のスキーマが使用されます。マイニング・モデルのネーミングにおける制限の詳細は、「マイニング・モデルのネーミングにおける制限」を参照してください。

構文

DBMS_DATA_MINING.RENAME_MODEL (
     model_name            IN VARCHAR2,
     new_model_name        IN VARCHAR2);

パラメータ

表38-81 RENAME_MODELプロシージャのパラメータ

パラメータ	説明
`model_name`	モデルの現在の名前。
`new_model_name`	モデルの新しい名前。

使用上の注意

ただし、APPLYでモデルを使用しているときに、そのモデルの名前を変更すると、RENAME操作は成功しますが、APPLYからは不確定な結果が戻されます。

例

census_modelというモデルがあるとします。次の例は、このモデルの名前を変更する方法を示しています。

BEGIN
  DBMS_DATA_MINING.RENAME_MODEL(
    model_name      => 'census_model',
    new_model_name  => 'census_new_model');
END;
/

列名	データ型
`actual_target_value`	`NUMBER`または`VARCHAR2`
`predicted_target_value`	`NUMBER`または`VARCHAR2`
`cost`	`NUMBER`