Oracle Data Miner 4.2の新機能および変更点

Oracle Data Miner 4.2は、一般的な拡張とともに、新機能で拡張されています。

新機能は次のとおりです。

Oracle Data Miningの機能

Oracle Data Miningの新機能は次のとおりです。

相関モデルの集計メトリック
Oracle Data Miner 4.2では、相関ルール・アルゴリズムの拡張版がサポートされており、相関モデルを構築する前に項目をフィルタ処理できるようになっています。
アルゴリズム設定の拡張
Oracle Data Miner 4.2は、パーティション・モデルの構築、トレーニング・データのサンプリング、シフトやスケール変換といった数値データ準備などの構築設定を含め、Oracle Data Miningの拡張をサポートするように拡張されています。
明示的セマンティック分析アルゴリズムのサポート
Oracle Data Miner 4.2では、明示的セマンティック分析アルゴリズムと呼ばれる新しい特徴抽出アルゴリズムがサポートされています。
Data Miningのモデル・ディテール・ビューの拡張
Oracle Data Miner 4.2のモデル・ビューアは、Oracle Data Miningの変更を反映するように拡張されています。
フィルタ列ノードの拡張
Oracle Data Miningでは、監視なしの属性重要度ランキングがサポートされています。列の属性重要度ランキングは、ターゲット列を選択しなくても生成されます。フィルタ列ノードは、監視なしの属性重要度ランキングをサポートするように拡張されています。
マイニング・モデル構築アラート
Oracle Data Miner 4.2では、モデル構築に関するアラートがモデル・ビューアおよびイベント・ログに記録されます。
Rモデル構築ノード
Oracle Data Miningには、Oracle Data Miningフレームワーク内にRモデル実装を追加するための機能が用意されています。Oracle Data Miner 4.2は、Rモデル統合をサポートするために、分類、回帰、クラスタリング、特徴抽出などのマイニング機能を持つ新しいR構築ノードに対応するように拡張されています。
パーティション化されたモデルのサポート
Oracle Data Miner 4.2では、パーティション化されたモデルの構築およびテストがサポートされています。

相関モデルの集計メトリック

Oracle Data Miner 4.2では、相関ルール・アルゴリズムの拡張版がサポートされており、相関モデルを構築する前に項目をフィルタ処理できるようになっています。

ユーザーは、相関構築ノード・エディタ、相関モデル・ビューアおよびモデル詳細ノード・エディタでフィルタを設定できます。

アルゴリズム設定の拡張

Oracle Data Miner 4.2は、パーティション・モデルの構築、トレーニング・データのサンプリング、シフトやスケール変換といった数値データ準備などの構築設定を含め、Oracle Data Miningの拡張をサポートするように拡張されています。

注意:

これらの設定は、Oracle Data Miner 4.2をOracle Database 12.2に接続している場合に使用できます。

アルゴリズムの変更点は次のとおりです。

ディシジョン・ツリー・アルゴリズム設定の変更点
「最大監視対象ビン」設定(CLAS_MAX_SUP_BINS)がディシジョン・ツリー・アルゴリズムに追加されています。
期待値の最大化アルゴリズム設定の変更点
現在のクラスタ統計の収集設定のかわりに、「詳細のレベル」設定が追加されています。
一般化線形モデル・アルゴリズム設定の変更点
一般化線形モデル・アルゴリズム設定に次の変更が組み込まれています。これらの変更は分類モデルと回帰モデルの両方に当てはまります。
k-Meansアルゴリズム設定の変更点
k-Meansアルゴリズム設定に次の変更が組み込まれています。
サポート・ベクター・マシン・アルゴリズム設定の変更点
サポート・ベクター・マシン・アルゴリズム設定に次の変更が組み込まれています。これらの変更は線形関数とガウス・カーネル関数の両方に当てはまります。
特異値分解および主成分分析アルゴリズム設定の変更点
特異値分解および主成分分析アルゴリズムに次の変更が組み込まれています。

ディシジョン・ツリー・アルゴリズム設定の変更点

「最大監視対象ビン」設定(CLAS_MAX_SUP_BINS)がディシジョン・ツリー・アルゴリズムに追加されています。

期待値の最大化アルゴリズム設定の変更点

現在のクラスタ統計の収集設定のかわりに、「詳細のレベル」設定が追加されています。

基礎となるアルゴリズム設定としてEMCS_CLUSTER_STATISTICS (すべて=有効化および階層=無効化)が使用されます。さらに、いくつかの設定が追加され、いくつかの設定が非推奨になりました。

追加された設定:

乱数シード
モデル検索
小さいコンポーネントの削除

非推奨になった設定:

概算(ODMS_APPROXIMATE_COMPUTATION)

一般化線形モデル・アルゴリズム設定の変更点

一般化線形モデル・アルゴリズム設定に次の変更が組み込まれています。これらの変更は分類モデルと回帰モデルの両方に当てはまります。

追加された設定:

収束許容値(GLMS_CONV_TOLERANCE)
反復数(GLMS_NUM_ITERATIONS)
バッチ行(GLMS_BATCH_ROWS)
ソルバー(GLMS_SOLVER)
スパース・ソルバー(GLMS_SPARSE_SOLVER)

非推奨になった設定:

概算(ODMS_APPROXIMATE_COMPUTATION)
カテゴリ型予測子の処理(GLMS_SELECT_BLOCK)
機能識別のサンプリング(GLMS_FTR_IDENTIFICATION)
機能の受入れ(GLMS_FTR_ACCEPTANCE)

k-Meansアルゴリズム設定の変更点

k-Meansアルゴリズム設定に次の変更が組み込まれています。

追加された設定:

詳細のレベル(KMNS_DETAILS)
乱数シード(KMNS_RANDOM_SEEDS)

非推奨になった設定:

増加係数

サポート・ベクター・マシン・アルゴリズム設定の変更点

サポート・ベクター・マシン・アルゴリズム設定に次の変更が組み込まれています。これらの変更は線形関数とガウス・カーネル関数の両方に当てはまります。

追加された設定:

ソルバー(SVMS_SOLVER)
反復数(SVMS_NUM_ITERATIONS)
拘束条件(SVMS_REGULARIZER)
バッチ行(SVMS_BATCH_ROWS)
ピボット数(SVMS_NUM_PIVOTS)
注意:
ガウス・カーネル関数のみに当てはまります。

非推奨になった設定:

能動学習
キャッシュ・サイズ(SVMS_KERNEL_CACHE_SIZE)
注意:
ガウス・カーネル関数のみに当てはまります。

特異値分解および主成分分析アルゴリズム設定の変更点

特異値分解および主成分分析アルゴリズムに次の変更が組み込まれています。

追加された設定:

ソルバー(SVDS_SOLVER)
許容範囲(SVDS_TOLERANCE)
乱数シード(SVDS_RANDOM_SEED)
オーバー・サンプリング(SVDS_OVER_SAMPLING)
べき乗法(SVDS_POWER_ITERATION)

非推奨になった設定:

概算(ODMS_APPROXIMATE_COMPUTATION)

明示的セマンティック分析アルゴリズムのサポート

Oracle Data Miner 4.2では、明示的セマンティック分析アルゴリズムと呼ばれる新しい特徴抽出アルゴリズムがサポートされています。

このアルゴリズムは、2つの新しいノード(明示的特徴抽出ノードと特徴比較ノード)でサポートされています。

明示的特徴抽出ノード
明示的特徴抽出ノードは、明示的セマンティック分析アルゴリズムを使用して構築されます。
特徴比較ノード
特徴比較ノードを使用すると、2つの異なるデータ・ソース・ノードに含まれているテキスト・データについて、セマンティック関連の計算を実行して比較できます。

明示的特徴抽出ノード

明示的特徴抽出ノードは、明示的セマンティック分析アルゴリズムを使用して構築されます。

明示的特徴抽出ノードは次の目的で使用できます。

ドキュメント分類
情報の取得
セマンティックに関連する計算

特徴比較ノード

特徴比較ノードを使用すると、2つの異なるデータ・ソース・ノードに含まれているテキスト・データについて、セマンティック関連の計算を実行して比較できます。

特徴比較ノードの要件は、次のとおりです。

2つの入力データ・ソース。データ・ソースには、データ・ソース・ノードで接続されているレコードなどの複数のレコードのデータ・フローまたはノード内でユーザーが入力する単一レコード・データを指定できます。ユーザーが入力するデータの場合、入力データ・プロバイダは不要です。
1つの特徴抽出モデルまたは明示的特徴抽出モデルを入力として使用します(セマンティック関連の計算の対象としてモデルを選択できる場合)。

Data Miningのモデル・ディテール・ビューの拡張

Oracle Data Miner 4.2のモデル・ビューアは、Oracle Data Miningの変更を反映するように拡張されています。

モデル・ビューアの拡張には次のようなものがあります。

モデル内の計算済設定がモデル・ビューアの「設定」タブに表示されます。
新しいユーザー組込み型の変換ディクショナリ・ビューが「設定」の「入力」タブと統合されています。
構築詳細データが「サマリー」の「サマリー」タブに表示されます
詳細が不完全なモデルがクラスタ・モデル・ビューアにより検出され、その旨を示すメッセージが表示されます。これは、k-Meansモデル・ビューアおよび期待値の最大化モデル・ビューアにも当てはまります。

フィルタ列ノードの拡張

Oracle Data Miningでは、監視なしの属性重要度ランキングがサポートされています。列の属性重要度ランキングは、ターゲット列を選択しなくても生成されます。フィルタ列ノードは、監視なしの属性重要度ランキングをサポートするように拡張されています。

マイニング・モデル構築アラート

Oracle Data Miner 4.2では、モデル構築に関するアラートがモデル・ビューアおよびイベント・ログに記録されます。

モデルが構築されると、モデル構築に関するアラートの有無についてOracle Data MinerサーバーからOracle Data Miningに問合せが行われます。アラートは次の場所に記録されます。

モデル・ビューア: 構築アラートは、「アラート」タブに表示されます。
イベント・ログ: すべての構築アラートがその他の詳細(ジョブ名、ノード、サブノード、時間、メッセージなど)とともに表示されます。

Rモデル構築ノード

Oracle Data Miningには、Oracle Data Miningフレームワーク内にRモデル実装を追加するための機能が用意されています。Oracle Data Miner 4.2は、Rモデル統合をサポートするために、分類、回帰、クラスタリング、特徴抽出などのマイニング機能を持つ新しいR構築ノードに対応するように拡張されています。

パーティション化されたモデルのサポート

Oracle Data Miner 4.2では、パーティション化されたモデルの構築およびテストがサポートされています。

次のモデルは、パーティション化されたモデルをサポートするように拡張されています。

構築ノード
適用ノード
テスト・ノード

Oracle Data Minerの機能

Oracle Data Minerの新機能は次のとおりです。

集計ノードでのDATEおよびTIMESTAMPデータ型のサポート
集計ノードは、DATEおよびTIMESTAMPデータ型をサポートするように拡張されています。
JSON問合せノードの拡張
JSON問合せノードでは、ARRAY、BOOLEAN、NUMBER、STRINGなどのデータ型を持つ属性に対してフィルタ条件を指定できます。
構築ノードの拡張
すべての構築ノードは、トレーニング・データのサンプリングおよび数値データの準備をサポートするように拡張されています。
テキスト設定の拡張
テキスト設定は、次の機能をサポートするように拡張されています。
入力データ定義のリフレッシュ
新しい列の追加または列の削除をワークフローに反映するには、「入力データ定義のリフレッシュ」オプションを使用します。
その他のデータ型のサポート
Oracle Data Miner 4.2では、次のデータ型をデータ・ソース・ノードの列として入力したり、ワークフロー内の新しい計算列として入力できます。
インメモリー列のサポート
Oracle Data Minerでは、Oracle Database 12.1.0.2以上のインメモリー列ストア(IM列ストア)がサポートされています。インメモリー列ストアは、表およびパーティションのコピーを特殊な列形式で格納するために任意に使用できる静的SGAプールです。
ワークフロー・スケジュールのサポート
Oracle Data Miner 4.2では、所定の日時に実行されるようにワークフローをスケジュールするための機能がサポートされています。
ポーリング・パフォーマンスの拡張
ポーリング・パフォーマンスおよびリソース使用率の機能が拡張され、新しいユーザー・インタフェースが導入されています。
ワークフロー・ステータスのポーリング・パフォーマンスの改善
ワークフロー・ステータスのポーリング・パフォーマンスが拡張されています。

集計ノードでのDATEおよびTIMESTAMPデータ型のサポート

集計ノードは、DATEおよびTIMESTAMPデータ型をサポートするように拡張されています。

DATEおよびTIMESTAMPデータ型に対して使用できる関数は、COUNT()、COUNT (DISTINCT())、MAX()、MEDIAN()、MIN()、STATS_MODE()です。

JSON問合せノードの拡張

JSON問合せノードでは、ARRAY、BOOLEAN、NUMBER、STRINGなどのデータ型を持つ属性に対してフィルタ条件を指定できます。

ユーザーは、「フィルタ設定」ダイアログ・ボックスの「すべて」または「いずれか」オプションを使用して、データに階層順にフィルタを適用できます。ユーザーは、次のいずれかのオプションを使用して、リレーショナル・データ投影用のデータと集計定義用のデータのいずれにフィルタを適用するか、あるいはこの両方にフィルタを適用するかを指定することもできます。

JSONネスト解除 - リレーショナル・データ・フォーマットへの投影に使用されるJSONデータにフィルタを適用します。
集計 - 集計に使用されるJSONデータにフィルタを適用します。
JSONネスト解除および集計 - 両方にフィルタを適用します。

構築ノードの拡張

すべての構築ノードは、トレーニング・データのサンプリングおよび数値データの準備をサポートするように拡張されています。

拡張は、すべての構築ノード・エディタの「サンプリング」タブに実装されています。デフォルトでは、「サンプリング」オプションは「オフ」に設定されています。「オン」に設定すると、ユーザーがサンプルの行サイズを指定したり、システムによって決定された設定を選択できるようになります。

注意:

データ準備は相関構築モデルではサポートされていません。

「サンプリング」オプションは次の構築ノード・エディタで使用できます。

異常検出ノードの編集
相関構築ノードの編集
分類構築ノードの編集
クラスタリング構築ノードの編集
明示的特徴抽出構築ノードの編集
特徴抽出構築ノードの編集
回帰構築ノードの編集

テキスト設定の拡張

テキスト設定は、次の機能をサポートするように拡張されています。

シノニム(シソーラス)のテキスト・サポート: Oracle Data Minerのテキスト・マイニングではシノニムがサポートされています。デフォルトでは、シソーラスはロードされません。ユーザーは、Oracle Textに用意されているデフォルト・シソーラスを手動でロードしたり、独自のシソーラスをアップロードする必要があります。
「テキスト」タブに新規に追加された設定:
- トークンに最低限必要な行(ドキュメント)数
- すべての行(ドキュメント)にわたる最大トークン数
- BIGRAM設定に新規に追加されたトークン:
  - BIGRAM: この場合、NORMALトークンとそのバイグラムが混在します
  - STEM BIGRAM: この場合、STEMトークンが抽出されてから、ステム・バイグラムが形成されます。

入力データ定義のリフレッシュ

新しい列の追加または列の削除をワークフローに反映するには、「入力データ定義のリフレッシュ」オプションを使用します。

「入力データ定義のリフレッシュ」オプションは、入力ソースのSELECT*機能と同等です。このオプションを使用すると、ワークフロー定義をすばやくリフレッシュして、該当する列を含めたり、除外できます。

注意:

「入力データ定義のリフレッシュ」オプションは、データ・ソース・ノードおよびSQL問合せノードのコンテキスト・メニュー・オプションとして使用できます。

その他のデータ型のサポート

Oracle Data Miner 4.2では、次のデータ型をデータ・ソース・ノードの列として入力したり、ワークフロー内の新しい計算列として入力できます。

RAW
ROWID
UROWID
URITYPE

URITYPEデータ型には多数のサブタイプ・インスタンスがあり、それらのインスタンスもOracle Data Miner 4.2でサポートされています。これらを次に示します。

HTTPURITYPE
DBURITYPE
XDBURITYPE

インメモリー列のサポート

Oracle Data Minerでは、Oracle Database 12.1.0.2以上のインメモリー列ストア(IM列ストア)がサポートされています。インメモリー列ストアは、表およびパーティションのコピーを特殊な列形式で格納するために任意に使用できる静的SGAプールです。

Oracle Data Miner 4.2は、ワークフローのノードでインメモリー列をサポートするように拡張されています。インメモリー列の設定については、「ノードのパフォーマンス設定の編集」ダイアログ・ボックスにデータ圧縮方法および優先度レベルを設定するためのオプションが用意されています。

ワークフロー・スケジュールのサポート

Oracle Data Miner 4.2では、所定の日時に実行されるようにワークフローをスケジュールするための機能がサポートされています。

スケジュール済ワークフローは読取り専用です。必要に応じて、スケジュール済ワークフローを取り消すことができます。スケジュール済ワークフローを取り消すと、編集して再スケジュールできるようになります。

ポーリング・パフォーマンスの拡張

ポーリング・パフォーマンスおよびリソース使用率の機能が拡張され、新しいユーザー・インタフェースが導入されています。

拡張は次の機能でサポートされています。

ユーザー・インタフェースでワークフロー・ステータスを自動または手動のどちらで問い合せるかを指定するためのリポジトリ・プロパティPOLLING_IDLE_ENABLEDが追加されています。該当するユーザー・インタフェースは、「ワークフロー・ジョブ」と「スケジュール済ジョブ」です。ただし、実行中のワークフローを監視している場合は、ワークフロー・エディタで引き続き自動ポーリングが行われます。
注意:
POLLING_IDLE_ENABLEDをTRUEに設定すると、ワークフロー・ステータスの自動問合せが設定されます。POLLING_IDLE_ENABLEDをFALSEに設定すると、手動問合せが設定されます。

スケジュール済ワークフローという新しいドッキング可能ウィンドウが追加され、スケジュール済ジョブのリストを参照して管理できるようになりました。
「ワークフロー・ジョブ」ウィンドウが拡張され、次の新機能が追加されています。
- ワークフロー・ジョブを手動でリフレッシュできます。
- Oracle Data Minerのリポジトリ設定を使用して自動更新を管理目的でオーバーライドできます。
- 新しい「設定」オプションから「ワークフロー・ジョブ」プリファレンスにアクセスできます。

ワークフロー・ステータスのポーリング・パフォーマンスの改善

ワークフロー・ステータスのポーリング・パフォーマンスが拡張されています。

拡張の内容は、新しいリポジトリ・ビュー、リポジトリ・プロパティおよびユーザー・インタフェースの変更です。

ワークフロー・ステータスをポーリングするためのリポジトリ・ビューODMR_USER_WORKFLOW_ALL_POLLが追加されています。
次のリポジトリ・プロパティが追加されています。
- POLLING_IDLE_RATE: 実行中のワークフローが検出されなかった場合にクライアントでデータベースをポーリングする頻度を指定します。
- POLLING_ACTIVE_RATE: 実行中のワークフローが検出された場合にクライアントでデータベースをポーリングする頻度を指定します。
- POLLING_IDLE_ENABLED: ユーザー・インタフェースでワークフロー・ステータスを自動または手動のどちらで問い合せるかを指定します。該当するユーザー・インタフェースは、「ワークフロー・ジョブ」と「スケジュール済ジョブ」です。ただし、実行中のワークフローを監視している場合は、ワークフロー・エディタで引き続き自動ポーリングが行われます。
  注意:
  POLLING_IDLE_ENABLEDをTRUEに設定すると、ワークフロー・ステータスの自動問合せが設定されます。POLLING_IDLE_ENABLEDをFALSEに設定すると、手動問合せが設定されます。
- POLLING_COMPLETED_WINDOW: 完了したワークフローをポーリング問合せの結果に含めるために必要な時間を指定します。
- PURGE_WORKFLOW_SCHEDULER_JOBS: Data Minerワークフローの実行によって生成された古いOracle Schedulerオブジェクトをパージします。
- PURGE_WORKFLOW_EVENT_LOG: 各ワークフローのワークフロー実行をイベント・ログにいくつ保持するかを制御します。この制限内に収まるように、古いワークフローのイベントはパージされます。
新しいユーザー・インタフェースとして、「スケジュール済ジョブ」ウィンドウが追加されています。このウィンドウには、SQL Developer 4.2の「ツール」メニューと「表示」メニューの両方にある「Data Miner」オプションからアクセスできます。

Oracle Databaseの機能

Oracle Databaseの新機能としては、拡張オブジェクト名のサポートがあります。

今後のOracle Databaseリリースでは、128バイトのスキーマ名、表名、列名およびシノニムがサポートされています。Oracle Databaseに対応するため、Oracle Data Minerのリポジトリ・ビュー、表、XMLスキーマおよびPL/SQLパッケージは、128バイトの名前をサポートするように拡張されています。