Oracle Data Minerの新機能および変更点

Oracle Data Minerは、次の新機能および一般的な拡張機能から構成されています。

新機能は次のとおりです。

Oracle Machine Learningの機能

Oracle Machine Learningの新機能は次のとおりです。

相関モデルの集計メトリック

Oracle Data Miner では拡張した相関ルール・アルゴリズムをサポートしており、これを使用すると、ユーザーは相関モデルを構築する前にアイテムをフィルタできます。

ユーザーは、相関構築ノード・エディタ、相関モデル・ビューアおよびモデル詳細ノード・エディタでフィルタを設定できます。

関連項目

アルゴリズム設定の拡張

Oracle Data Minerは、パーティション・モデルの構築、トレーニング・データのサンプリング、シフトやスケール変換といった数値データ準備などの構築設定を含め、Oracle Machine Learningの拡張をサポートするように拡張されています。

ノート:

これらの設定は、Oracle Data Miner 21.2以上をOracle Database 12.2以上に接続している場合に使用できます。

アルゴリズムの変更点は次のとおりです。

ディシジョン・ツリー・アルゴリズム設定の変更点

「最大教師ありビン」設定(CLAS_MAX_SUP_BINS)がディシジョン・ツリー・アルゴリズムに追加されています。

期待値の最大化アルゴリズム設定の変更点

現在のクラスタ統計の収集設定のかわりに、「詳細のレベル」設定が追加されています。

基礎となるアルゴリズム設定としてEMCS_CLUSTER_STATISTICS (この場合、すべて=有効化階層=無効化)が使用されます。いくつかの設定がさらに追加され、いくつかの設定が非推奨になりました。

追加された設定:
  • 乱数シード

  • モデル検索

  • 小さいコンポーネントの削除

非推奨になった設定:

概算(ODMS_APPROXIMATE_COMPUTATION)

一般化線形モデル・アルゴリズム設定の変更点

一般化線形モデル・アルゴリズム設定に次の変更が組み込まれています。これらの変更は分類モデルと回帰モデルの両方に当てはまります。

追加された設定:
  • 収束許容値(GLMS_CONV_TOLERANCE)

  • 反復数(GLMS_NUM_ITERATIONS)

  • バッチ行(GLMS_BATCH_ROWS)

  • ソルバー(GLMS_SOLVER)

  • スパース・ソルバー(GLMS_SPARSE_SOLVER)

非推奨になった設定:
  • 概算(ODMS_APPROXIMATE_COMPUTATION)

  • カテゴリ型予測子の処理(GLMS_SELECT_BLOCK)

  • 機能識別のサンプリング(GLMS_FTR_IDENTIFICATION)

  • 機能の受入れ(GLMS_FTR_ACCEPTANCE)

k-Meansアルゴリズム設定の変更点

k-Meansアルゴリズム設定に次の変更が組み込まれています。

追加された設定:
  • 詳細のレベル(KMNS_DETAILS)

  • 乱数シード(KMNS_RANDOM_SEEDS)

非推奨になった設定:
  • 増加係数

サポート・ベクター・マシン・アルゴリズム設定の変更点

サポート・ベクター・マシン・アルゴリズム設定に次の変更が組み込まれています。これらの変更は線形関数とガウス・カーネル関数の両方に当てはまります。

追加された設定:
  • ソルバー(SVMS_SOLVER)

  • 反復数(SVMS_NUM_ITERATIONS)

  • 拘束条件(SVMS_REGULARIZER)

  • バッチ行(SVMS_BATCH_ROWS)

  • ピボット数(SVMS_NUM_PIVOTS)

    ノート:

    ガウス・カーネル関数のみに当てはまります。
非推奨になった設定:
  • 能動学習

  • キャッシュ・サイズ(SVMS_KERNEL_CACHE_SIZE)

    ノート:

    ガウス・カーネル関数のみに当てはまります。
特異値分解および主成分分析アルゴリズム設定の変更点

特異値分解および主成分分析アルゴリズムに次の変更が組み込まれています。

追加された設定:
  • ソルバー(SVDS_SOLVER)

  • 許容範囲(SVDS_TOLERANCE)

  • 乱数シード(SVDS_RANDOM_SEED)

  • オーバー・サンプリング(SVDS_OVER_SAMPLING)

  • べき乗法(SVDS_POWER_ITERATION)

非推奨になった設定:
  • 概算(ODMS_APPROXIMATE_COMPUTATION)

明示的セマンティック分析アルゴリズムのサポート

Oracle Data Miner 21.2以降では、明示的セマンティック分析アルゴリズムと呼ばれる新機能の抽出アルゴリズムをサポートしています。

このアルゴリズムは、2つの新しいノード(明示的特徴抽出ノードと特徴比較ノード)でサポートされています。

明示的特徴抽出ノード

明示的特徴抽出ノードは、明示的セマンティック分析アルゴリズムを使用して構築されます。

明示的特徴抽出ノードは次の目的で使用できます。
  • ドキュメント分類

  • 情報の取得

  • セマンティックに関連する計算

特徴比較ノード

特徴比較ノードを使用すると、2つの異なるデータ・ソース・ノードに含まれているテキスト・データについて、セマンティック関連の計算を実行して比較できます。

特徴比較ノードの要件は、次のとおりです。
  • 2つの入力データ・ソース。データ・ソースには、データ・ソース・ノードで接続されているレコードなどの複数のレコードのデータ・フローまたはノード内でユーザーが入力する単一レコード・データを指定できます。ユーザーが入力するデータの場合、入力データ・プロバイダは不要です。

  • 1つの特徴抽出モデルまたは明示的特徴抽出モデルを入力として使用します(セマンティック関連の計算の対象としてモデルを選択できる場合)。

Oracle Machine Learningのモデル・ディテール・ビューの拡張

Oracle Data Minerのモデル・ビューアは、Oracle Machine Learningの変更を反映するように拡張されています。

モデル・ビューアの拡張には次のようなものがあります。

  • モデル内の計算済設定がモデル・ビューアの「設定」タブに表示されます。

  • 新しいユーザー組込み型の変換ディクショナリ・ビューが「設定」「入力」タブと統合されています。

  • 構築詳細データが「サマリー」「サマリー」タブに表示されます

  • 詳細が不完全なモデルがクラスタ・モデル・ビューアにより検出され、その旨を示すメッセージが表示されます。これは、k-Meansモデル・ビューアおよび期待値の最大化モデル・ビューアにも当てはまります。

フィルタ列ノードの拡張

Oracle Machine Learningでは、教師なしの属性重要度ランキングがサポートされています。列の属性重要度ランキングは、ターゲット列を選択しなくても生成されます。フィルタ列ノードは、教師なしの属性重要度ランキングをサポートするように拡張されています。

マイニング・モデル構築アラート

Oracle Data Miner では、モデル構築に関するアラートがモデル・ビューアおよびイベント・ログに記録されます。

モデルが構築されると、モデル構築に関するアラートの有無についてOracle Data MinerサーバーからOracle Machine Learningに問合せが行われます。アラートは次の場所に記録されます。
  • モデル・ビューア: 構築アラートは、「アラート」タブに表示されます。

  • イベント・ログ: すべての構築アラートがその他の詳細(ジョブ名、ノード、サブノード、時間、メッセージなど)とともに表示されます。

Rモデル構築ノード

Oracle Machine Learningには、Oracle Machine Learningフレームワーク内でRモデル実装を追加する機能があります。Oracle Data Minerは、Rモデル統合をサポートするために、分類、回帰、クラスタリング、特徴抽出などの機械学習を備えた新しいR構築ノードに対応するように拡張されています。

パーティション化されたモデルのサポート

Oracle Data Miner では、パーティション化されたモデルの構築およびテストがサポートされています。

次のモデルは、パーティション化されたモデルをサポートするように拡張されています。
  • 構築ノード

  • 適用ノード

  • テスト・ノード

Oracle Machine Learningの機能

Oracle Machine Learningの新機能は次のとおりです。

集計ノードでのDATEおよびTIMESTAMPデータ型のサポート

集計ノードは、DATEおよびTIMESTAMPデータ型をサポートするように拡張されています。

DATEおよびTIMESTAMPデータ型に対して使用できる関数は、COUNT()、COUNT (DISTINCT())、MAX()、MEDIAN()、MIN()、STATS_MODE()です。

JSON問合せノードの拡張

JSON問合せノードでは、ARRAY、BOOLEAN、NUMBERSTRINGなどのデータ型を持つ属性に対してフィルタ条件を指定できます。

ユーザーは、「フィルタ設定」ダイアログ・ボックスの「すべて」または「いずれか」オプションを使用して、データに階層順にフィルタを適用できます。ユーザーは、次のいずれかのオプションを使用して、リレーショナル・データ投影用のデータと集計定義用のデータのいずれにフィルタを適用するか、あるいはこの両方にフィルタを適用するかを指定することもできます。
  • JSONネスト解除 - リレーショナル・データ・フォーマットへの投影に使用されるJSONデータにフィルタを適用します。

  • 集計 - 集計に使用されるJSONデータにフィルタを適用します。

  • JSONネスト解除および集計 - 両方にフィルタを適用します。

構築ノードの拡張

すべての構築ノードは、トレーニング・データのサンプリングおよび数値データの準備をサポートするように拡張されています。

拡張は、すべての構築ノード・エディタの「サンプリング」タブに実装されています。デフォルトでは、「サンプリング」オプションは「オフ」に設定されています。「オン」に設定した場合は、ユーザーが、サンプル行サイズを指定するかシステムによって決定された設定を選択できます。

ノート:

データ準備は相関構築モデルではサポートされていません。
「サンプリング」オプションは次の構築ノード・エディタで使用できます。
  • 異常検出ノードの編集

  • 相関構築ノードの編集

  • 分類構築ノードの編集

  • クラスタリング構築ノードの編集

  • 明示的特徴抽出構築ノードの編集

  • 特徴抽出構築ノードの編集

  • 回帰構築ノードの編集

テキスト設定の拡張

テキスト設定は、次の機能をサポートするように拡張されています。

  • シノニム(シソーラス)のテキスト・サポート: Oracle Data Minerのテキスト・マイニングではシノニムがサポートされています。デフォルトでは、シソーラスはロードされません。ユーザーは、Oracle Textに用意されているデフォルト・シソーラスを手動でロードしたり、独自のシソーラスをアップロードする必要があります。

  • 「テキスト」タブに新規に追加された設定:

    • トークンに最低限必要な行(ドキュメント)数

    • すべての行(ドキュメント)にわたる最大トークン数

    • BIGRAM設定に新規に追加されたトークン:

      • BIGRAM: この場合、NORMALトークンとそのバイグラムが混在します

      • STEM BIGRAM: この場合、STEMトークンが抽出されてから、ステム・バイグラムが形成されます。

入力データ定義のリフレッシュ

新しい列の追加または列の削除をワークフローに反映するには、「入力データ定義のリフレッシュ」オプションを使用します。

「入力データ定義のリフレッシュ」オプションは、入力ソースのSELECT*機能と同等です。このオプションを使用すると、ワークフロー定義をすばやくリフレッシュして、該当する列を含めたり、除外できます。

ノート:

「入力データ定義のリフレッシュ」オプションは、データ・ソース・ノードおよびSQL問合せノードのコンテキスト・メニュー・オプションとして使用できます。

その他のデータ型のサポート

Oracle Data Miner では、次のデータ型をデータ・ソース・ノードの列として入力したり、ワークフロー内の新しい計算列として入力できます。

  • RAW

  • ROWID

  • UROWID

  • URITYPE

URITYPEデータ型には多数のサブタイプ・インスタンスがあり、それらのインスタンスもOracle Data Minerでサポートされています。これらを次に示します。
  • HTTPURITYPE

  • DBURITYPE

  • XDBURITYPE

インメモリー列のサポート

Oracle Data Minerでは、Oracle Database 12.2以上のインメモリー列ストア(IM列ストア)がサポートされています。インメモリー列ストアは、表およびパーティションのコピーを特殊な列形式で格納するために任意に使用できる静的SGAプールです。

Oracle Data Miner は、ワークフローのノードでインメモリー列をサポートするように拡張されています。インメモリー列の設定については、「ノードのパフォーマンス設定の編集」ダイアログ・ボックスにデータ圧縮方法および優先度レベルを設定するためのオプションが用意されています。

ワークフロー・スケジュールのサポート

Oracle Data Miner では、ワークフローを特定の日時に実行するようにスケジュールする機能をサポートしています。

スケジュール済ワークフローは読取り専用です。必要に応じて、スケジュール済ワークフローを取り消すことができます。スケジュール済ワークフローを取り消すと、編集して再スケジュールできるようになります。

ポーリング・パフォーマンスの拡張

ポーリング・パフォーマンスおよびリソース使用率の機能が拡張され、新しいユーザー・インタフェースが導入されています。

拡張は次の機能でサポートされています。
  • ユーザー・インタフェースでワークフロー・ステータスを自動または手動のどちらで問い合せるかを指定するためのリポジトリ・プロパティPOLLING_IDLE_ENABLEDが追加されています。該当するユーザー・インタフェースは、「ワークフロー・ジョブ」と「スケジュール済ジョブ」です。ただし、実行中のワークフローを監視している場合は、ワークフロー・エディタで引き続き自動ポーリングが行われます。

    ノート:

    POLLING_IDLE_ENABLEDTRUEに設定すると、ワークフロー・ステータスの自動問合せが設定されます。POLLING_IDLE_ENABLEDFALSEに設定すると、手動問合せが設定されます。

    スケジュール済ワークフローという新しいドッキング可能ウィンドウが追加され、スケジュール済ジョブのリストを参照して管理できるようになりました。

  • 「ワークフロー・ジョブ」ウィンドウが拡張され、次の新機能が追加されています。
    • ワークフロー・ジョブを手動でリフレッシュできます。

    • Oracle Data Minerのリポジトリ設定を使用して自動更新を管理目的でオーバーライドできます。

    • 新しい「設定」オプションから「ワークフロー・ジョブ」プリファレンスにアクセスできます。

ワークフロー・ステータスのポーリング・パフォーマンスの改善

ワークフロー・ステータスのポーリング・パフォーマンスが拡張されています。

拡張の内容は、新しいリポジトリ・ビュー、リポジトリ・プロパティおよびユーザー・インタフェースの変更です。

  • ワークフロー・ステータスをポーリングするためのリポジトリ・ビューODMR_USER_WORKFLOW_ALL_POLLが追加されています。

  • 次のリポジトリ・プロパティが追加されています。

    • POLLING_IDLE_RATE: 実行中のワークフローが検出されなかった場合にクライアントでデータベースをポーリングする頻度を指定します。

    • POLLING_ACTIVE_RATE: 実行中のワークフローが検出された場合にクライアントでデータベースをポーリングする頻度を指定します。

    • POLLING_IDLE_ENABLED: ユーザー・インタフェースでワークフロー・ステータスを自動または手動のどちらで問い合せるかを指定します。該当するユーザー・インタフェースは、「ワークフロー・ジョブ」と「スケジュール済ジョブ」です。ただし、実行中のワークフローを監視している場合は、ワークフロー・エディタで引き続き自動ポーリングが行われます。

      ノート:

      POLLING_IDLE_ENABLEDTRUEに設定すると、ワークフロー・ステータスの自動問合せが設定されます。POLLING_IDLE_ENABLEDFALSEに設定すると、手動問合せが設定されます。
    • POLLING_COMPLETED_WINDOW: 完了したワークフローをポーリング問合せの結果に含めるために必要な時間を指定します。

    • PURGE_WORKFLOW_SCHEDULER_JOBS: Data Minerワークフローの実行によって生成された古いOracle Schedulerオブジェクトをパージします。

    • PURGE_WORKFLOW_EVENT_LOG: 各ワークフローのワークフロー実行をイベント・ログにいくつ保持するかを制御します。この制限内に収まるように、古いワークフローのイベントはパージされます。

  • 新しいユーザー・インタフェースとして、「スケジュール済ジョブ」ウィンドウが追加されています。このウィンドウには、SQL Developer 21.2以降の「ツール」メニューと「表示」メニューの両方にある「Data Miner」オプションからアクセスできます。

Oracle Databaseの機能

Oracle Databaseの新機能としては、拡張オブジェクト名のサポートがあります。

今後のOracle Databaseリリースでは、128バイトのスキーマ名、表名、列名およびシノニムがサポートされています。Oracle Databaseに対応するため、Oracle Data Minerのリポジトリ・ビュー、表、XMLスキーマおよびPL/SQLパッケージは、128バイトの名前をサポートするように拡張されています。