Oracle Data Miningの新機能

この項では、Oracle Data Mining 11g リリース1（11.1）の新機能について説明し、追加情報の参照先を紹介します。また、前のリリースでの新機能も引き続き掲載されているので、現行リリースへの移行時にも役立ちます。

次のトピックで、Oracle Data Miningの新機能について説明します。

Oracle Data Mining 11g リリース1（11.1）の新機能
Oracle Data Mining 10g リリース2（10.2）の新機能

Oracle Data Mining 11g リリース1（11.1）の新機能

マイニング・モデルのスキーマ・オブジェクト

Oracle 11gでは、データ・マイニング・モデルがSYSスキーマ内のデータ・ディクショナリ・オブジェクトとして実装されています。新しく追加された一連のデータ・ディクショナリ・ビューで、マイニング・モデルとそのプロパティを参照できます。マイニング・モデル・オブジェクトに対するアクセスは、新しいシステムおよびオブジェクト権限で制御されます。

データ・マイニング・モデルは、前のリリースでは、DMSYSスキーマ内の表の集合およびメタデータとして実装されていました。Oracle 11gには、DMSYSスキーマはありません。

Oracle Data Mining Java APIの拡張

Oracle Data Mining Java API（OJDM）は、Oracle Data Mining 11g リリース1（11.1）の新機能を完全にサポートしています。この項では、Java APIの新機能について概説します。詳細は、『Oracle Data Mining Java API Reference』（javadoc）を参照してください。

「マイニング・モデルのスキーマ・オブジェクト」で説明したように、11g リリース1（11.1）のマイニング・モデルは、SYSスキーマのデータ・ディクショナリ・オブジェクトです。マイニング・モデルに対するアクセスは、システム権限およびオブジェクト権限で制御されます。

Oracle Data Mining Java APIには、ユーザーがアクセス可能なマイニング・オブジェクトをリスト表示するための新しい拡張メソッドOraConnection.getObjectNamesが追加されています。このメソッドでは、必要に応じてアプリケーションで使用できる様々なオブジェクト・フィルタリング・オプションが提供されています。
「自動データ準備（ADP）」で説明したように、Oracle Data Mining 11g リリース1（11.1）では、自動データ準備および組込みのデータ準備（スーパーモデル）がサポートされています。

Oracle Data Mining Java APIには、ADPを有効化するための新しい構築設定拡張メソッドOraBuildSettings.useAutomatedDataPreparationsが追加されています。新しいOraBuildTask.setTransformationSequenceNameを使用すると、アプリケーションでモデルに変換を組み込むことができます。
2つのGLMパッケージ（oracle.dmt.jdm.algorithm.glmおよびoracle.dmt.jdm.modeldetail.glm）が新たに導入されました。これらのパッケージはそれぞれ、GLMアルゴリズム設定インタフェースとモデルの詳細インタフェースを持ちます。
分類の適用出力の確率限界を示すための新しい適用コンテンツ列挙値probabilityLowerBoundおよびprobabilityUpperBoundが追加されています。列挙体oracle.dmt.jdm.supervised.classification.OraClassificationApplyContentはこれらの列挙値を示します。同様に、回帰モデルの適用出力の予測限界を示すための適用コンテンツ列挙値predictionLowerBoundおよびpredictionUpperBoundが追加されています。このリリースでは、GLMモデルのみがこの機能をサポートしています。
モデルへのコスト・マトリックスの関連付けをサポートする新しい静的メソッドaddCostMatrixおよびremoveCostMatrixがOraClassificationModelに追加されています。これによって、モデルとともにコストを容易に配置できます。
マイニング・タスク機能がマイニング・プロセス・ワークフローの作成をサポートするように拡張されています。新しいOraTask.addDependencyメソッドを使用すると、アプリケーションで従属タスクを指定できます。もう1つの注目すべき新しいタスク機能はoverwriteOutputです。これは、新しいOraTask.overwriteOutputメソッドを呼び出して有効化できます。

これらの新機能を使用すると、アプリケーションで容易にマイニング・プロセス・ワークフローを開発し、データベース・サーバーに配置できます。これらのタスク・ワークフローは、クライアント側から監視できます。これらのメソッドの使用方法については、製品に含まれているデモ・プログラムを参照してください（デモ・プログラムの詳細は、『Oracle Data Mining管理者ガイド』を参照）。
新しいマイニング・オブジェクトoracle.dmt.jdm.transform.OraTransformationSequenceでは、ユーザー定義の変換シーケンスの指定がサポートされます。これらのシーケンスは、マイニング・モデルに組み込んだり、外部で管理したりできます。さらに、新しいOraExpressionTransformオブジェクトを使用すると、モデルに含めるSQL式を指定できます。
新しい予測分析プロファイル機能をサポートするために、oracle.dmt.jdm.OraProfileTaskが新たに追加されています。
Oracle Data Mining Java APIは、Oracle Database 11g リリース1（11.1）およびOracle Database 10.2とともに使用できます。10.2データベースとともに使用する場合、利用できるのは10.2の機能のみです。

Oracle Data Mining 10g リリース2（10.2）の新機能

Java Data Mining（JDM）準拠のJava API

Oracle 10g リリース2では、データ・マイニング用にまったく新しいJava APIが導入されました。このAPIはJSR-000073を実装し、Java Community Process（http://jcp.org）で開発されたものです。

この新しいJava APIはPL/SQL API上に用意され、2つのAPI間には完全な相互運用性があります。この新しいJava APIと前のリリース（Oracle 10g リリース1）で使用可能なJava APIとの間に互換性はありません。
データ・マイニング用のSQL組込み関数

新しく導入された組込みSQL関数で、分類、回帰、クラスタリングおよび特徴抽出モデルのスコアリングがサポートされます。標準的なSQL文のコンテキスト内で、あらかじめ作成したモデルを新しいデータに適用でき、結果が以降の処理用に戻されます。データ・マイニング用のSQL関数は次のとおりです。
- PREDICTION、PREDICTION_COST、PREDICTION_DETAILS、PREDICTION_PROBABILITY、PREDICTION_SET
- CLUSTER_ID、CLUSTER_PROBABILITY、CLUSTER_SET
- FEATURE_ID、FEATURE_SET、FEATURE_VALUE
予測分析

データ・マイニングのプロセスは予測分析によって自動化されます。予測分析ルーチンにより、データ準備、アルゴリズムの選択、モデルの作成およびモデルのスコアリングが管理され、ユーザーの介入が不要になりました。

DBMS_PREDICTIVE_ANALYTICS PL/SQLパッケージにある予測分析ルーチンでは、予測が計算され、予測における各属性の相対的な影響が判断されます。

DBMS_PREDICTIVE_ANALYTICSは、Oracle Spreadsheet Add-In for Predictive AnalyticsによってExcelのスプレッドシート内に実装されます。このSpreadsheet Add-InはOracle Technology Networkで入手できます。
新しいアルゴリズムと拡張されたアルゴリズム
- 新しく導入されたディシジョン・ツリー・アルゴリズムでは、予測用に人間が理解できるルールが生成されます。
- 新しく導入された1クラス・サポート・ベクター・マシン・アルゴリズムでは、異常検出がサポートされます。
- このサポート・ベクター・マシン・アルゴリズムは、大規模な作成データセットを管理するための能動学習により拡張されます。
- PL/SQLとJava APIの両方でO-Clusterアルゴリズムがサポートされます。Oracle 10g リリース1では、O-ClusterはJava APIでのみサポートされていました。