マイニング機能の選択

マイニング機能は、CREATE_MODELプロシージャに必須の引数です。データ・マイニング機能によって、モデル化や解決の対象となり得る問題のクラスが特定されます。

データ・マイニング機能は、監視あり学習または監視なし学習のいずれかを実装しています。監視あり学習では、独立属性のセットを使用して従属属性の値またはターゲットを予測します。監視なし学習では従属属性と独立属性は区別されません。監視あり機能は予測的です。監視なし機能は記述的です。

注意:

データ・マイニングの用語では、機能(function)とは、特定のデータ・マイニング・アプローチを使用して解決される問題の一般的な種類です。SQL言語の用語では、関数(function)は値を戻す演算子です。

Oracle Data Miningのドキュメントでは、機能(function)またはマイニング機能(mining function)という用語は、データ・マイニング機能を表し、SQL関数(SQL function)またはSQLデータ・マイニング関数(SQL Data Mining function)という用語は、スコアリング(データ・マイニング・モデルの適用)用のSQL関数を表します。

CREATE_MODELのmining_functionパラメータには、次の表にあるいずれの値も指定できます。

表5-2 マイニング・モデルの機能

Mining_Functionの値	説明
`ASSOCIATION`	相関は、記述マイニング機能の一種です。相関モデルによって、データ・セット内に存在する関係とその発生確率が識別されます(相関ルール)。相関モデルではAprioriアルゴリズムが使用されます。
`ATTRIBUTE_IMPORTANCE`	属性評価(Attribute Importance)は、予測マイニング機能の一種です。属性評価モデルにより、特定の結果を予測する中で属性の相対的な重要度が識別されます。属性評価モデルでは、最小記述長アルゴリズムが使用されます。
`CLASSIFICATION`	分類(Classification)は、予測マイニング機能の一種です。分類モデルでは、質的ターゲットの予測に履歴データが使用されます。分類モデルでは、Naive Bayes、ディシジョン・ツリー、ロジスティック回帰またはサポート・ベクター・マシンが使用されます。デフォルトはNaive Bayesです。分類機能は、異常検出にも使用可能です。この場合、ターゲットがNULLであるSVMアルゴリズムが使用されます(1クラスSVM)。
`CLUSTERING`	クラスタリングは、記述マイニング機能の一種です。クラスタリング・モデルにより、データセット内の自然なグループ分けが識別されます。クラスタリング・モデルでは、k-Means、O-Clusterまたは期待値最大化が使用されます。デフォルトはk-Meansです。
`FEATURE_EXTRACTION`	特徴抽出(Feature Extraction)は、記述マイニング機能の一種です。特徴抽出モデルにより、最適化された属性のセットが作成されます。特徴抽出モデルでは、Non-Negative Matrix Factorizationまたは特異値分解(主成分分析にも使用可能)が使用されます。デフォルトはNon-Negative Matrix Factorizationです。
`REGRESSION`	回帰(Regression)は、予測マイニング機能の一種です。回帰モデルでは、量的ターゲットの予測に履歴データが使用されます。回帰モデルでは、サポート・ベクター・マシンまたは線形回帰の使用が可能です。デフォルトはサポート・ベクター・マシンです。