プライマリ・コンテンツに移動
Oracle® Data Miningユーザーズ・ガイド
12c リリース1 (12.1)
B72967-05
目次へ移動
目次
索引へ移動
索引

前
次

マイニング機能の選択

マイニング機能は、CREATE_MODELプロシージャに必須の引数です。データ・マイニング機能によって、モデル化や解決の対象となり得る問題のクラスが特定されます。

データ・マイニング機能は、監視あり学習または監視なし学習のいずれかを実装しています。監視あり学習では、独立属性のセットを使用して従属属性の値またはターゲットを予測します。監視なし学習では従属属性と独立属性は区別されません。監視あり機能は予測的です。監視なし機能は記述的です。

注意:

データ・マイニングの用語では、機能(function)とは、特定のデータ・マイニング・アプローチを使用して解決される問題の一般的な種類です。SQL言語の用語では、関数(function)は値を戻す演算子です。

Oracle Data Miningのドキュメントでは、機能(function)またはマイニング機能(mining function)という用語は、データ・マイニング機能を表し、SQL関数(SQL function)またはSQLデータ・マイニング関数(SQL Data Mining function)という用語は、スコアリング(データ・マイニング・モデルの適用)用のSQL関数を表します。

CREATE_MODELmining_functionパラメータには、次の表にあるいずれの値も指定できます。

表5-2 マイニング・モデルの機能

Mining_Functionの値 説明

ASSOCIATION

相関は、記述マイニング機能の一種です。相関モデルによって、データ・セット内に存在する関係とその発生確率が識別されます(相関ルール)。

相関モデルではAprioriアルゴリズムが使用されます。

ATTRIBUTE_IMPORTANCE

属性評価(Attribute Importance)は、予測マイニング機能の一種です。属性評価モデルにより、特定の結果を予測する中で属性の相対的な重要度が識別されます。

属性評価モデルでは、最小記述長アルゴリズムが使用されます。

CLASSIFICATION

分類(Classification)は、予測マイニング機能の一種です。分類モデルでは、質的ターゲットの予測に履歴データが使用されます。

分類モデルでは、Naive Bayes、ディシジョン・ツリー、ロジスティック回帰またはサポート・ベクター・マシンが使用されます。デフォルトはNaive Bayesです。

分類機能は、異常検出にも使用可能です。この場合、ターゲットがNULLであるSVMアルゴリズムが使用されます(1クラスSVM)。

CLUSTERING

クラスタリングは、記述マイニング機能の一種です。クラスタリング・モデルにより、データセット内の自然なグループ分けが識別されます。

クラスタリング・モデルでは、k-Means、O-Clusterまたは期待値最大化が使用されます。デフォルトはk-Meansです。

FEATURE_EXTRACTION

特徴抽出(Feature Extraction)は、記述マイニング機能の一種です。特徴抽出モデルにより、最適化された属性のセットが作成されます。

特徴抽出モデルでは、Non-Negative Matrix Factorizationまたは特異値分解(主成分分析にも使用可能)が使用されます。デフォルトはNon-Negative Matrix Factorizationです。

REGRESSION

回帰(Regression)は、予測マイニング機能の一種です。回帰モデルでは、量的ターゲットの予測に履歴データが使用されます。

回帰モデルでは、サポート・ベクター・マシンまたは線形回帰の使用が可能です。デフォルトはサポート・ベクター・マシンです。

関連項目:

マイニング機能の概要は、『Oracle Data Mining概要』を参照してください。