Oracle Data Minerの新機能および変更点
Oracle Data Minerは、次の新機能および一般的な拡張機能から構成されています。
新機能は次のとおりです。
Oracle Machine Learningの機能
Oracle Machine Learningの新機能は次のとおりです。
- 相関モデルの集計メトリック
Oracle Data Miner では、相関ルール・アルゴリズムの拡張版がサポートされており、相関モデルを構築する前に項目をフィルタ処理できるようになっています。 - アルゴリズム設定の拡張
Oracle Data Minerは、パーティション・モデルの構築、トレーニング・データのサンプリング、シフトやスケール変換といった数値データ準備などの構築設定を含め、Oracle Machine Learningの拡張をサポートするように拡張されています。 - 明示的セマンティック分析アルゴリズムのサポート
Oracle Data Miner 21.2以降では、明示的セマンティック分析アルゴリズムと呼ばれる新しい特徴抽出アルゴリズムがサポートされています。 - Oracle Machine Learningのモデル・ディテール・ビューの拡張
Oracle Data Minerのモデル・ビューアは、Oracle Machine Learningの変更を反映するように拡張されています。 - フィルタ列ノードの拡張
Oracle Machine Learningでは、教師なしの属性重要度ランキングがサポートされています。列の属性重要度ランキングは、ターゲット列を選択しなくても生成されます。フィルタ列ノードは、教師なしの属性重要度ランキングをサポートするように拡張されています。 - マイニング・モデル構築アラート
Oracle Data Miner では、モデル構築に関するアラートがモデル・ビューアおよびイベント・ログに記録されます。 - Rモデル構築ノード
Oracle Machine Learningには、Oracle Machine Learningフレームワーク内でRモデル実装を追加する機能があります。Oracle Data Minerは、Rモデル統合をサポートするために、分類、回帰、クラスタリング、特徴抽出などの機械学習を備えた新しいR構築ノードに対応するように拡張されています。 - パーティション化されたモデルのサポート
Oracle Data Miner では、パーティション化されたモデルの構築およびテストがサポートされています。
親トピック: Oracle Data Minerの新機能および変更点
相関モデルの集計メトリック
Oracle Data Miner では拡張した相関ルール・アルゴリズムをサポートしており、これを使用すると、ユーザーは相関モデルを構築する前にアイテムをフィルタできます。
ユーザーは、相関構築ノード・エディタ、相関モデル・ビューアおよびモデル詳細ノード・エディタでフィルタを設定できます。
関連項目
親トピック: Oracle Machine Learningの機能
アルゴリズム設定の拡張
Oracle Data Minerは、パーティション・モデルの構築、トレーニング・データのサンプリング、シフトやスケール変換といった数値データ準備などの構築設定を含め、Oracle Machine Learningの拡張をサポートするように拡張されています。
ノート:
これらの設定は、Oracle Data Miner 21.2以上をOracle Database 12.2以上に接続している場合に使用できます。アルゴリズムの変更点は次のとおりです。
- ディシジョン・ツリー・アルゴリズム設定の変更点
「最大教師ありビン」設定(CLAS_MAX_SUP_BINS
)がディシジョン・ツリー・アルゴリズムに追加されています。 - 期待値の最大化アルゴリズム設定の変更点
現在のクラスタ統計の収集
設定のかわりに、「詳細のレベル」
設定が追加されています。 - 一般化線形モデル・アルゴリズム設定の変更点
一般化線形モデル・アルゴリズム設定に次の変更が組み込まれています。これらの変更は分類モデルと回帰モデルの両方に当てはまります。 - k-Meansアルゴリズム設定の変更点
k-Meansアルゴリズム設定に次の変更が組み込まれています。 - サポート・ベクター・マシン・アルゴリズム設定の変更点
サポート・ベクター・マシン・アルゴリズム設定に次の変更が組み込まれています。これらの変更は線形関数とガウス・カーネル関数の両方に当てはまります。 - 特異値分解および主成分分析アルゴリズム設定の変更点
特異値分解および主成分分析アルゴリズムに次の変更が組み込まれています。
親トピック: Oracle Machine Learningの機能
ディシジョン・ツリー・アルゴリズム設定の変更点
「最大教師ありビン」設定(CLAS_MAX_SUP_BINS
)がディシジョン・ツリー・アルゴリズムに追加されています。
親トピック: アルゴリズム設定の拡張
期待値の最大化アルゴリズム設定の変更点
現在のクラスタ統計の収集
設定のかわりに、「詳細のレベル」
設定が追加されています。
基礎となるアルゴリズム設定としてEMCS_CLUSTER_STATISTICS
(この場合、すべて=有効化
、階層=無効化
)が使用されます。いくつかの設定がさらに追加され、いくつかの設定が非推奨になりました。
-
乱数シード
-
モデル検索
-
小さいコンポーネントの削除
非推奨になった設定:
概算(ODMS_APPROXIMATE_COMPUTATION
)
親トピック: アルゴリズム設定の拡張
一般化線形モデル・アルゴリズム設定の変更点
一般化線形モデル・アルゴリズム設定に次の変更が組み込まれています。これらの変更は分類モデルと回帰モデルの両方に当てはまります。
-
収束許容値(
GLMS_CONV_TOLERANCE
) -
反復数(
GLMS_NUM_ITERATIONS
) -
バッチ行(
GLMS_BATCH_ROWS
) -
ソルバー(
GLMS_SOLVER
) -
スパース・ソルバー(
GLMS_SPARSE_SOLVER
)
-
概算(
ODMS_APPROXIMATE_COMPUTATION
) -
カテゴリ型予測子の処理(
GLMS_SELECT_BLOCK
) -
機能識別のサンプリング(
GLMS_FTR_IDENTIFICATION
) -
機能の受入れ(
GLMS_FTR_ACCEPTANCE
)
親トピック: アルゴリズム設定の拡張
k-Meansアルゴリズム設定の変更点
k-Meansアルゴリズム設定に次の変更が組み込まれています。
-
詳細のレベル(
KMNS_DETAILS
) -
乱数シード(
KMNS_RANDOM_SEEDS
)
-
増加係数
親トピック: アルゴリズム設定の拡張
サポート・ベクター・マシン・アルゴリズム設定の変更点
サポート・ベクター・マシン・アルゴリズム設定に次の変更が組み込まれています。これらの変更は線形関数とガウス・カーネル関数の両方に当てはまります。
-
ソルバー(
SVMS_SOLVER
) -
反復数(
SVMS_NUM_ITERATIONS
) -
拘束条件(
SVMS_REGULARIZER
) -
バッチ行(
SVMS_BATCH_ROWS
) -
ピボット数(
SVMS_NUM_PIVOTS
)ノート:
ガウス・カーネル関数のみに当てはまります。
-
能動学習
-
キャッシュ・サイズ(
SVMS_KERNEL_CACHE_SIZE
)ノート:
ガウス・カーネル関数のみに当てはまります。
親トピック: アルゴリズム設定の拡張
特異値分解および主成分分析アルゴリズム設定の変更点
特異値分解および主成分分析アルゴリズムに次の変更が組み込まれています。
-
ソルバー(
SVDS_SOLVER
) -
許容範囲(
SVDS_TOLERANCE
) -
乱数シード(
SVDS_RANDOM_SEED
) -
オーバー・サンプリング(
SVDS_OVER_SAMPLING
) -
べき乗法(
SVDS_POWER_ITERATION
)
-
概算(
ODMS_APPROXIMATE_COMPUTATION
)
親トピック: アルゴリズム設定の拡張
明示的セマンティック分析アルゴリズムのサポート
Oracle Data Miner 21.2以降では、明示的セマンティック分析アルゴリズムと呼ばれる新機能の抽出アルゴリズムをサポートしています。
このアルゴリズムは、2つの新しいノード(明示的特徴抽出ノードと特徴比較ノード)でサポートされています。
- 明示的特徴抽出ノード
明示的特徴抽出ノードは、明示的セマンティック分析アルゴリズムを使用して構築されます。 - 特徴比較ノード
特徴比較ノードを使用すると、2つの異なるデータ・ソース・ノードに含まれているテキスト・データについて、セマンティック関連の計算を実行して比較できます。
親トピック: Oracle Machine Learningの機能
明示的特徴抽出ノード
明示的特徴抽出ノードは、明示的セマンティック分析アルゴリズムを使用して構築されます。
-
ドキュメント分類
-
情報の取得
-
セマンティックに関連する計算
親トピック: 明示的セマンティック分析アルゴリズムのサポート
特徴比較ノード
特徴比較ノードを使用すると、2つの異なるデータ・ソース・ノードに含まれているテキスト・データについて、セマンティック関連の計算を実行して比較できます。
-
2つの入力データ・ソース。データ・ソースには、データ・ソース・ノードで接続されているレコードなどの複数のレコードのデータ・フローまたはノード内でユーザーが入力する単一レコード・データを指定できます。ユーザーが入力するデータの場合、入力データ・プロバイダは不要です。
-
1つの特徴抽出モデルまたは明示的特徴抽出モデルを入力として使用します(セマンティック関連の計算の対象としてモデルを選択できる場合)。
親トピック: 明示的セマンティック分析アルゴリズムのサポート
Oracle Machine Learningのモデル・ディテール・ビューの拡張
Oracle Data Minerのモデル・ビューアは、Oracle Machine Learningの変更を反映するように拡張されています。
モデル・ビューアの拡張には次のようなものがあります。
-
モデル内の計算済設定がモデル・ビューアの「設定」タブに表示されます。
-
新しいユーザー組込み型の変換ディクショナリ・ビューが「設定」の「入力」タブと統合されています。
-
構築詳細データが「サマリー」の「サマリー」タブに表示されます
-
詳細が不完全なモデルがクラスタ・モデル・ビューアにより検出され、その旨を示すメッセージが表示されます。これは、k-Meansモデル・ビューアおよび期待値の最大化モデル・ビューアにも当てはまります。
親トピック: Oracle Machine Learningの機能
フィルタ列ノードの拡張
Oracle Machine Learningでは、教師なしの属性重要度ランキングがサポートされています。列の属性重要度ランキングは、ターゲット列を選択しなくても生成されます。フィルタ列ノードは、教師なしの属性重要度ランキングをサポートするように拡張されています。
親トピック: Oracle Machine Learningの機能
マイニング・モデル構築アラート
Oracle Data Miner では、モデル構築に関するアラートがモデル・ビューアおよびイベント・ログに記録されます。
-
モデル・ビューア: 構築アラートは、「アラート」タブに表示されます。
-
イベント・ログ: すべての構築アラートがその他の詳細(ジョブ名、ノード、サブノード、時間、メッセージなど)とともに表示されます。
親トピック: Oracle Machine Learningの機能
Rモデル構築ノード
Oracle Machine Learningには、Oracle Machine Learningフレームワーク内でRモデル実装を追加する機能があります。Oracle Data Minerは、Rモデル統合をサポートするために、分類、回帰、クラスタリング、特徴抽出などの機械学習を備えた新しいR構築ノードに対応するように拡張されています。
親トピック: Oracle Machine Learningの機能
パーティション化されたモデルのサポート
Oracle Data Miner では、パーティション化されたモデルの構築およびテストがサポートされています。
-
構築ノード
-
適用ノード
-
テスト・ノード
親トピック: Oracle Machine Learningの機能
Oracle Machine Learningの機能
Oracle Machine Learningの新機能は次のとおりです。
- 集計ノードでのDATEおよびTIMESTAMPデータ型のサポート
集計ノードは、DATEおよびTIMESTAMPデータ型をサポートするように拡張されています。 - JSON問合せノードの拡張
JSON問合せノードでは、ARRAY、BOOLEAN、NUMBER
、STRING
などのデータ型を持つ属性に対してフィルタ条件を指定できます。 - 構築ノードの拡張
すべての構築ノードは、トレーニング・データのサンプリングおよび数値データの準備をサポートするように拡張されています。 - テキスト設定の拡張
テキスト設定は、次の機能をサポートするように拡張されています。 - 入力データ定義のリフレッシュ
新しい列の追加または列の削除をワークフローに反映するには、「入力データ定義のリフレッシュ」オプションを使用します。 - その他のデータ型のサポート
Oracle Data Miner では、次のデータ型をデータ・ソース・ノードの列として入力したり、ワークフロー内の新しい計算列として入力できます。 - インメモリー列のサポート
Oracle Data Minerでは、Oracle Database 12.2以上のインメモリー列ストア(IM列ストア)がサポートされています。インメモリー列ストアは、表およびパーティションのコピーを特殊な列形式で格納するために任意に使用できる静的SGAプールです。 - ワークフロー・スケジュールのサポート
Oracle Data Miner では、所定の日時に実行されるようにワークフローをスケジュールするための機能がサポートされています。 - ポーリング・パフォーマンスの拡張
ポーリング・パフォーマンスおよびリソース使用率の機能が拡張され、新しいユーザー・インタフェースが導入されています。 - ワークフロー・ステータスのポーリング・パフォーマンスの改善
ワークフロー・ステータスのポーリング・パフォーマンスが拡張されています。
親トピック: Oracle Data Minerの新機能および変更点
集計ノードでのDATEおよびTIMESTAMPデータ型のサポート
集計ノードは、DATEおよびTIMESTAMPデータ型をサポートするように拡張されています。
DATEおよびTIMESTAMPデータ型に対して使用できる関数は、COUNT()、COUNT (DISTINCT())、MAX()、MEDIAN()、MIN()、STATS_MODE()
です。
親トピック: Oracle Machine Learningの機能
JSON問合せノードの拡張
JSON問合せノードでは、ARRAY、BOOLEAN、NUMBER
、STRING
などのデータ型を持つ属性に対してフィルタ条件を指定できます。
「すべて」
または「いずれか」
オプションを使用して、データに階層順にフィルタを適用できます。ユーザーは、次のいずれかのオプションを使用して、リレーショナル・データ投影用のデータと集計定義用のデータのいずれにフィルタを適用するか、あるいはこの両方にフィルタを適用するかを指定することもできます。
-
JSONネスト解除 - リレーショナル・データ・フォーマットへの投影に使用されるJSONデータにフィルタを適用します。
-
集計 - 集計に使用されるJSONデータにフィルタを適用します。
-
JSONネスト解除および集計 - 両方にフィルタを適用します。
親トピック: Oracle Machine Learningの機能
構築ノードの拡張
すべての構築ノードは、トレーニング・データのサンプリングおよび数値データの準備をサポートするように拡張されています。
拡張は、すべての構築ノード・エディタの「サンプリング」タブに実装されています。デフォルトでは、「サンプリング」オプションは「オフ」
に設定されています。「オン」
に設定した場合は、ユーザーが、サンプル行サイズを指定するかシステムによって決定された設定を選択できます。
ノート:
データ準備は相関構築モデルではサポートされていません。-
異常検出ノードの編集
-
相関構築ノードの編集
-
分類構築ノードの編集
-
クラスタリング構築ノードの編集
-
明示的特徴抽出構築ノードの編集
-
特徴抽出構築ノードの編集
-
回帰構築ノードの編集
親トピック: Oracle Machine Learningの機能
テキスト設定の拡張
テキスト設定は、次の機能をサポートするように拡張されています。
-
シノニム(シソーラス)のテキスト・サポート: Oracle Data Minerのテキスト・マイニングではシノニムがサポートされています。デフォルトでは、シソーラスはロードされません。ユーザーは、Oracle Textに用意されているデフォルト・シソーラスを手動でロードしたり、独自のシソーラスをアップロードする必要があります。
-
「テキスト」タブに新規に追加された設定:
-
トークンに最低限必要な行(ドキュメント)数
-
すべての行(ドキュメント)にわたる最大トークン数
-
BIGRAM設定に新規に追加されたトークン:
-
BIGRAM:
この場合、NORMAL
トークンとそのバイグラムが混在します -
STEM BIGRAM:
この場合、STEM
トークンが抽出されてから、ステム・バイグラムが形成されます。
-
-
親トピック: Oracle Machine Learningの機能
入力データ定義のリフレッシュ
新しい列の追加または列の削除をワークフローに反映するには、「入力データ定義のリフレッシュ」オプションを使用します。
SELECT*
機能と同等です。このオプションを使用すると、ワークフロー定義をすばやくリフレッシュして、該当する列を含めたり、除外できます。
ノート:
「入力データ定義のリフレッシュ」オプションは、データ・ソース・ノードおよびSQL問合せノードのコンテキスト・メニュー・オプションとして使用できます。親トピック: Oracle Machine Learningの機能
その他のデータ型のサポート
Oracle Data Miner では、次のデータ型をデータ・ソース・ノードの列として入力したり、ワークフロー内の新しい計算列として入力できます。
-
RAW
-
ROWID
-
UROWID
-
URITYPE
URITYPE
データ型には多数のサブタイプ・インスタンスがあり、それらのインスタンスもOracle Data Minerでサポートされています。これらを次に示します。
-
HTTPURITYPE
-
DBURITYPE
-
XDBURITYPE
親トピック: Oracle Machine Learningの機能
インメモリー列のサポート
Oracle Data Minerでは、Oracle Database 12.2以上のインメモリー列ストア(IM列ストア)がサポートされています。インメモリー列ストアは、表およびパーティションのコピーを特殊な列形式で格納するために任意に使用できる静的SGAプールです。
Oracle Data Miner は、ワークフローのノードでインメモリー列をサポートするように拡張されています。インメモリー列の設定については、「ノードのパフォーマンス設定の編集」ダイアログ・ボックスにデータ圧縮方法および優先度レベルを設定するためのオプションが用意されています。
親トピック: Oracle Machine Learningの機能
ワークフロー・スケジュールのサポート
Oracle Data Miner では、ワークフローを特定の日時に実行するようにスケジュールする機能をサポートしています。
スケジュール済ワークフローは読取り専用です。必要に応じて、スケジュール済ワークフローを取り消すことができます。スケジュール済ワークフローを取り消すと、編集して再スケジュールできるようになります。
親トピック: Oracle Machine Learningの機能
ポーリング・パフォーマンスの拡張
ポーリング・パフォーマンスおよびリソース使用率の機能が拡張され、新しいユーザー・インタフェースが導入されています。
-
ユーザー・インタフェースでワークフロー・ステータスを自動または手動のどちらで問い合せるかを指定するためのリポジトリ・プロパティ
POLLING_IDLE_ENABLED
が追加されています。該当するユーザー・インタフェースは、「ワークフロー・ジョブ」と「スケジュール済ジョブ」です。ただし、実行中のワークフローを監視している場合は、ワークフロー・エディタで引き続き自動ポーリングが行われます。ノート:
POLLING_IDLE_ENABLED
をTRUE
に設定すると、ワークフロー・ステータスの自動問合せが設定されます。POLLING_IDLE_ENABLED
をFALSE
に設定すると、手動問合せが設定されます。スケジュール済ワークフローという新しいドッキング可能ウィンドウが追加され、スケジュール済ジョブのリストを参照して管理できるようになりました。
-
「ワークフロー・ジョブ」ウィンドウが拡張され、次の新機能が追加されています。
-
ワークフロー・ジョブを手動でリフレッシュできます。
-
Oracle Data Minerのリポジトリ設定を使用して自動更新を管理目的でオーバーライドできます。
-
新しい「設定」オプションから「ワークフロー・ジョブ」プリファレンスにアクセスできます。
-
親トピック: Oracle Machine Learningの機能
ワークフロー・ステータスのポーリング・パフォーマンスの改善
ワークフロー・ステータスのポーリング・パフォーマンスが拡張されています。
拡張の内容は、新しいリポジトリ・ビュー、リポジトリ・プロパティおよびユーザー・インタフェースの変更です。
-
ワークフロー・ステータスをポーリングするためのリポジトリ・ビュー
ODMR_USER_WORKFLOW_ALL_POLL
が追加されています。 -
次のリポジトリ・プロパティが追加されています。
-
POLLING_IDLE_RATE:
実行中のワークフローが検出されなかった場合にクライアントでデータベースをポーリングする頻度を指定します。 -
POLLING_ACTIVE_RATE:
実行中のワークフローが検出された場合にクライアントでデータベースをポーリングする頻度を指定します。 -
POLLING_IDLE_ENABLED:
ユーザー・インタフェースでワークフロー・ステータスを自動または手動のどちらで問い合せるかを指定します。該当するユーザー・インタフェースは、「ワークフロー・ジョブ」と「スケジュール済ジョブ」です。ただし、実行中のワークフローを監視している場合は、ワークフロー・エディタで引き続き自動ポーリングが行われます。ノート:
POLLING_IDLE_ENABLED
をTRUE
に設定すると、ワークフロー・ステータスの自動問合せが設定されます。POLLING_IDLE_ENABLED
をFALSE
に設定すると、手動問合せが設定されます。 -
POLLING_COMPLETED_WINDOW:
完了したワークフローをポーリング問合せの結果に含めるために必要な時間を指定します。 -
PURGE_WORKFLOW_SCHEDULER_JOBS:
Data Minerワークフローの実行によって生成された古いOracle Schedulerオブジェクトをパージします。 -
PURGE_WORKFLOW_EVENT_LOG:
各ワークフローのワークフロー実行をイベント・ログにいくつ保持するかを制御します。この制限内に収まるように、古いワークフローのイベントはパージされます。
-
-
新しいユーザー・インタフェースとして、「スケジュール済ジョブ」ウィンドウが追加されています。このウィンドウには、SQL Developer 21.2以降の「ツール」メニューと「表示」メニューの両方にある「Data Miner」オプションからアクセスできます。
親トピック: Oracle Machine Learningの機能
Oracle Databaseの機能
Oracle Databaseの新機能としては、拡張オブジェクト名のサポートがあります。
今後のOracle Databaseリリースでは、128バイトのスキーマ名、表名、列名およびシノニムがサポートされています。Oracle Databaseに対応するため、Oracle Data Minerのリポジトリ・ビュー、表、XMLスキーマおよびPL/SQLパッケージは、128バイトの名前をサポートするように拡張されています。
親トピック: Oracle Data Minerの新機能および変更点