Oracle Data Miner 4.2は、一般的な拡張とともに、新機能で拡張されています。
新機能は次のとおりです。
Oracle Data Miningの新機能は次のとおりです。
Oracle Data Miner 4.2では、相関ルール・アルゴリズムの拡張版がサポートされており、相関モデルを構築する前に項目をフィルタ処理できるようになっています。
ユーザーは、相関構築ノード・エディタ、相関モデル・ビューアおよびモデル詳細ノード・エディタでフィルタを設定できます。
関連項目:
「相関モデルの集計メトリック」Oracle Data Miner 4.2は、パーティション・モデルの構築、トレーニング・データのサンプリング、シフトやスケール変換といった数値データ準備などの構築設定を含め、Oracle Data Miningの拡張をサポートするように拡張されています。
注意:
これらの設定は、Oracle Data Miner 4.2をOracle Database 12.2に接続している場合に使用できます。アルゴリズムの変更点は次のとおりです。
CLAS_MAX_SUP_BINS
)がディシジョン・ツリー・アルゴリズムに追加されています。クラスタ統計の収集
設定のかわりに、「詳細のレベル」
設定が追加されています。 現在のクラスタ統計の収集
設定のかわりに、「詳細のレベル」
設定が追加されています。
基礎となるアルゴリズム設定としてEMCS_CLUSTER_STATISTICS
(すべて=有効化
および階層=無効化
)が使用されます。さらに、いくつかの設定が追加され、いくつかの設定が非推奨になりました。
乱数シード
モデル検索
小さいコンポーネントの削除
非推奨になった設定:
概算(ODMS_APPROXIMATE_COMPUTATION
)
一般化線形モデル・アルゴリズム設定に次の変更が組み込まれています。これらの変更は分類モデルと回帰モデルの両方に当てはまります。
収束許容値(GLMS_CONV_TOLERANCE
)
反復数(GLMS_NUM_ITERATIONS
)
バッチ行(GLMS_BATCH_ROWS
)
ソルバー(GLMS_SOLVER
)
スパース・ソルバー(GLMS_SPARSE_SOLVER
)
概算(ODMS_APPROXIMATE_COMPUTATION
)
カテゴリ型予測子の処理(GLMS_SELECT_BLOCK
)
機能識別のサンプリング(GLMS_FTR_IDENTIFICATION
)
機能の受入れ(GLMS_FTR_ACCEPTANCE
)
k-Meansアルゴリズム設定に次の変更が組み込まれています。
詳細のレベル(KMNS_DETAILS
)
乱数シード(KMNS_RANDOM_SEEDS
)
増加係数
サポート・ベクター・マシン・アルゴリズム設定に次の変更が組み込まれています。これらの変更は線形関数とガウス・カーネル関数の両方に当てはまります。
ソルバー(SVMS_SOLVER
)
反復数(SVMS_NUM_ITERATIONS
)
拘束条件(SVMS_REGULARIZER
)
バッチ行(SVMS_BATCH_ROWS
)
SVMS_NUM_PIVOTS
)注意:
ガウス・カーネル関数のみに当てはまります。能動学習
SVMS_KERNEL_CACHE_SIZE
)注意:
ガウス・カーネル関数のみに当てはまります。Oracle Data Miner 4.2では、明示的セマンティック分析アルゴリズムと呼ばれる新しい特徴抽出アルゴリズムがサポートされています。
このアルゴリズムは、2つの新しいノード(明示的特徴抽出ノードと特徴比較ノード)でサポートされています。
明示的特徴抽出ノードは、明示的セマンティック分析アルゴリズムを使用して構築されます。
ドキュメント分類
情報の取得
セマンティックに関連する計算
特徴比較ノードを使用すると、2つの異なるデータ・ソース・ノードに含まれているテキスト・データについて、セマンティック関連の計算を実行して比較できます。
2つの入力データ・ソース。データ・ソースには、データ・ソース・ノードで接続されているレコードなどの複数のレコードのデータ・フローまたはノード内でユーザーが入力する単一レコード・データを指定できます。ユーザーが入力するデータの場合、入力データ・プロバイダは不要です。
1つの特徴抽出モデルまたは明示的特徴抽出モデルを入力として使用します(セマンティック関連の計算の対象としてモデルを選択できる場合)。
Oracle Data Miner 4.2のモデル・ビューアは、Oracle Data Miningの変更を反映するように拡張されています。
モデル・ビューアの拡張には次のようなものがあります。
モデル内の計算済設定がモデル・ビューアの「設定」タブに表示されます。
新しいユーザー組込み型の変換ディクショナリ・ビューが「設定」の「入力」タブと統合されています。
構築詳細データが「サマリー」の「サマリー」タブに表示されます
詳細が不完全なモデルがクラスタ・モデル・ビューアにより検出され、その旨を示すメッセージが表示されます。これは、k-Meansモデル・ビューアおよび期待値の最大化モデル・ビューアにも当てはまります。
Oracle Data Miningでは、監視なしの属性重要度ランキングがサポートされています。列の属性重要度ランキングは、ターゲット列を選択しなくても生成されます。フィルタ列ノードは、監視なしの属性重要度ランキングをサポートするように拡張されています。
Oracle Data Miner 4.2では、モデル構築に関するアラートがモデル・ビューアおよびイベント・ログに記録されます。
モデル・ビューア: 構築アラートは、「アラート」タブに表示されます。
イベント・ログ: すべての構築アラートがその他の詳細(ジョブ名、ノード、サブノード、時間、メッセージなど)とともに表示されます。
Oracle Data Minerの新機能は次のとおりです。
ARRAY、BOOLEAN、NUMBER
、STRING
などのデータ型を持つ属性に対してフィルタ条件を指定できます。 集計ノードは、DATEおよびTIMESTAMPデータ型をサポートするように拡張されています。
DATEおよびTIMESTAMPデータ型に対して使用できる関数は、COUNT()、COUNT (DISTINCT())、MAX()、MEDIAN()、MIN()、STATS_MODE()
です。
JSON問合せノードでは、ARRAY、BOOLEAN、NUMBER
、STRING
などのデータ型を持つ属性に対してフィルタ条件を指定できます。
「すべて」
または「いずれか」
オプションを使用して、データに階層順にフィルタを適用できます。ユーザーは、次のいずれかのオプションを使用して、リレーショナル・データ投影用のデータと集計定義用のデータのいずれにフィルタを適用するか、あるいはこの両方にフィルタを適用するかを指定することもできます。JSONネスト解除 - リレーショナル・データ・フォーマットへの投影に使用されるJSONデータにフィルタを適用します。
集計 - 集計に使用されるJSONデータにフィルタを適用します。
JSONネスト解除および集計 - 両方にフィルタを適用します。
すべての構築ノードは、トレーニング・データのサンプリングおよび数値データの準備をサポートするように拡張されています。
拡張は、すべての構築ノード・エディタの「サンプリング」タブに実装されています。デフォルトでは、「サンプリング」オプションは「オフ」
に設定されています。「オン」
に設定すると、ユーザーがサンプルの行サイズを指定したり、システムによって決定された設定を選択できるようになります。
注意:
データ準備は相関構築モデルではサポートされていません。異常検出ノードの編集
相関構築ノードの編集
分類構築ノードの編集
クラスタリング構築ノードの編集
明示的特徴抽出構築ノードの編集
特徴抽出構築ノードの編集
回帰構築ノードの編集
テキスト設定は、次の機能をサポートするように拡張されています。
シノニム(シソーラス)のテキスト・サポート: Oracle Data Minerのテキスト・マイニングではシノニムがサポートされています。デフォルトでは、シソーラスはロードされません。ユーザーは、Oracle Textに用意されているデフォルト・シソーラスを手動でロードしたり、独自のシソーラスをアップロードする必要があります。
「テキスト」タブに新規に追加された設定:
トークンに最低限必要な行(ドキュメント)数
すべての行(ドキュメント)にわたる最大トークン数
BIGRAM設定に新規に追加されたトークン:
BIGRAM:
この場合、NORMAL
トークンとそのバイグラムが混在します
STEM BIGRAM:
この場合、STEM
トークンが抽出されてから、ステム・バイグラムが形成されます。
新しい列の追加または列の削除をワークフローに反映するには、「入力データ定義のリフレッシュ」オプションを使用します。
SELECT*
機能と同等です。このオプションを使用すると、ワークフロー定義をすばやくリフレッシュして、該当する列を含めたり、除外できます。注意:
「入力データ定義のリフレッシュ」オプションは、データ・ソース・ノードおよびSQL問合せノードのコンテキスト・メニュー・オプションとして使用できます。Oracle Data Miner 4.2では、次のデータ型をデータ・ソース・ノードの列として入力したり、ワークフロー内の新しい計算列として入力できます。
RAW
ROWID
UROWID
URITYPE
URITYPE
データ型には多数のサブタイプ・インスタンスがあり、それらのインスタンスもOracle Data Miner 4.2でサポートされています。これらを次に示します。HTTPURITYPE
DBURITYPE
XDBURITYPE
Oracle Data Minerでは、Oracle Database 12.1.0.2以上のインメモリー列ストア(IM列ストア)がサポートされています。インメモリー列ストアは、表およびパーティションのコピーを特殊な列形式で格納するために任意に使用できる静的SGAプールです。
Oracle Data Miner 4.2は、ワークフローのノードでインメモリー列をサポートするように拡張されています。インメモリー列の設定については、「ノードのパフォーマンス設定の編集」ダイアログ・ボックスにデータ圧縮方法および優先度レベルを設定するためのオプションが用意されています。
Oracle Data Miner 4.2では、所定の日時に実行されるようにワークフローをスケジュールするための機能がサポートされています。
スケジュール済ワークフローは読取り専用です。必要に応じて、スケジュール済ワークフローを取り消すことができます。スケジュール済ワークフローを取り消すと、編集して再スケジュールできるようになります。
ポーリング・パフォーマンスおよびリソース使用率の機能が拡張され、新しいユーザー・インタフェースが導入されています。
POLLING_IDLE_ENABLED
が追加されています。該当するユーザー・インタフェースは、「ワークフロー・ジョブ」と「スケジュール済ジョブ」です。ただし、実行中のワークフローを監視している場合は、ワークフロー・エディタで引き続き自動ポーリングが行われます。注意:
POLLING_IDLE_ENABLED
をTRUE
に設定すると、ワークフロー・ステータスの自動問合せが設定されます。POLLING_IDLE_ENABLED
をFALSE
に設定すると、手動問合せが設定されます。スケジュール済ワークフローという新しいドッキング可能ウィンドウが追加され、スケジュール済ジョブのリストを参照して管理できるようになりました。
ワークフロー・ジョブを手動でリフレッシュできます。
Oracle Data Minerのリポジトリ設定を使用して自動更新を管理目的でオーバーライドできます。
新しい「設定」オプションから「ワークフロー・ジョブ」プリファレンスにアクセスできます。
ワークフロー・ステータスのポーリング・パフォーマンスが拡張されています。
拡張の内容は、新しいリポジトリ・ビュー、リポジトリ・プロパティおよびユーザー・インタフェースの変更です。
ワークフロー・ステータスをポーリングするためのリポジトリ・ビューODMR_USER_WORKFLOW_ALL_POLL
が追加されています。
次のリポジトリ・プロパティが追加されています。
POLLING_IDLE_RATE:
実行中のワークフローが検出されなかった場合にクライアントでデータベースをポーリングする頻度を指定します。
POLLING_ACTIVE_RATE:
実行中のワークフローが検出された場合にクライアントでデータベースをポーリングする頻度を指定します。
POLLING_IDLE_ENABLED:
ユーザー・インタフェースでワークフロー・ステータスを自動または手動のどちらで問い合せるかを指定します。該当するユーザー・インタフェースは、「ワークフロー・ジョブ」と「スケジュール済ジョブ」です。ただし、実行中のワークフローを監視している場合は、ワークフロー・エディタで引き続き自動ポーリングが行われます。注意:
POLLING_IDLE_ENABLED
をTRUE
に設定すると、ワークフロー・ステータスの自動問合せが設定されます。POLLING_IDLE_ENABLED
をFALSE
に設定すると、手動問合せが設定されます。POLLING_COMPLETED_WINDOW:
完了したワークフローをポーリング問合せの結果に含めるために必要な時間を指定します。
PURGE_WORKFLOW_SCHEDULER_JOBS:
Data Minerワークフローの実行によって生成された古いOracle Schedulerオブジェクトをパージします。
PURGE_WORKFLOW_EVENT_LOG:
各ワークフローのワークフロー実行をイベント・ログにいくつ保持するかを制御します。この制限内に収まるように、古いワークフローのイベントはパージされます。
新しいユーザー・インタフェースとして、「スケジュール済ジョブ」ウィンドウが追加されています。このウィンドウには、SQL Developer 4.2の「ツール」メニューと「表示」メニューの両方にある「Data Miner」オプションからアクセスできます。