Oracle® Data Miner
リリース・ノート
リリース18.3
F13438-01(原本部品番号:F10081-01)
2018年10月
Oracle Data Miner 18.3リリース・ノート相関モデルの集計メトリック
Oracle Data Miner では拡張した相関ルール・アルゴリズムをサポートしており、これを使用すると、ユーザーは相関モデルを構築する前にアイテムをフィルタできます。
ユーザーは、相関構築ノード・エディタ、相関モデル・ビューアおよびモデル詳細ノード・エディタでフィルタを設定できます。
アルゴリズム設定の拡張
Oracle Data Miner は、パーティション・モデルの構築時のビルド設定、研修データのサンプリング、シフトおよびスケール変換などの数値データの準備を含むOracle Data Miningの拡張機能をサポートするように拡張されました。
注意:
これらの設定は、Oracle Data Miner 18.2をOracle Database 12.2以上に接続している場合に使用できます。アルゴリズムの変更は次のとおりです。
期待値の最大化アルゴリズム設定の変更
「詳細のレベル」
を設定すると、現在の設定「クラスタ統計の収集」
が置き換わります。
使用される基礎となるアルゴリズム設定はEMCS_CLUSTER_STATISTICS
です(値はAll=ENABLE
およびHierarchy=DISABLE
)。追加された設定と非推奨になった設定があります。
-
乱数シード
-
モデル検索
-
小さいコンポーネントの削除
非推奨になった設定:
概算 ODMS_APPROXIMATE_COMPUTATION
一般化線形モデルのアルゴリズム設定の変更
次の変更が一般化線形モデルのアルゴリズム設定に含まれています。変更は分類モデルと回帰モデルの両方に適用されます。
-
収束許容値
GLMS_CONV_TOLERANCE
-
反復数
GLMS_NUM_ITERATIONS
-
バッチ行
GLMS_BATCH_ROWS
-
ソルバー
GLMS_SOLVER
-
スパース・ソルバー
GLMS_SPARSE_SOLVER
-
概算
ODMS_APPROXIMATE_COMPUTATION
-
カテゴリ型予測子の処理
GLMS_SELECT_BLOCK
-
機能識別のサンプリング
GLMS_FTR_IDENTIFICATION
-
機能の受入れ
GLMS_FTR_ACCEPTANCE
k-Meansアルゴリズム設定の変更
次の変更がk-Meansアルゴリズム設定に含まれています。
-
詳細のレベル
KMNS_DETAILS
-
乱数シード
KMNS_RANDOM_SEEDS
-
増加係数
Support Vector Machineのアルゴリズム設定の変更
次の変更がSupport Vector Machineのアルゴリズム設定に含まれています。この変更は、線形カーネル関数とガウス・カーネル関数の両方に適用可能です。
-
ソルバー
SVMS_SOLVER
-
反復数
SVMS_NUM_ITERATIONS
-
拘束条件
SVMS_REGULARIZER
-
バッチ行
SVMS_BATCH_ROWS
-
ピボット数
SVMS_NUM_PIVOTS
注意:
ガウス・カーネル関数にのみ適用されます。
-
アクティブな学習
-
キャッシュ・サイズ
SVMS_KERNEL_CACHE_SIZE
注意:
ガウス・カーネル関数にのみ適用されます。
単一値分解および主要コンポーネント分析アルゴリズム設定の変更
次の変更が単一値分解および主要コンポーネント分析アルゴリズムに含まれます。
-
ソルバー
SVDS_SOLVER
-
許容範囲
SVDS_TOLERANCE
-
乱数シード
SVDS_RANDOM_SEED
-
オーバー・サンプリング
SVDS_OVER_SAMPLING
-
べき乗法
SVDS_POWER_ITERATION
-
概算
ODMS_APPROXIMATE_COMPUTATION
明示的セマンティック分析アルゴリズムのサポート
Oracle Data Miner 18.2以降では、明示的セマンティック分析アルゴリズムと呼ばれる新機能の抽出アルゴリズムをサポートしています。
このアルゴリズムは、明示的機能抽出ノードと機能比較ノードの2つの新しいノードでサポートされています。
明示的機能抽出ノード
明示的機能抽出ノードは、明示的セマンティック分析アルゴリズムを使用して構築されます。
-
ドキュメント分類
-
情報の取得
-
セマンティックに関連する計算
機能比較ノード
機能比較ノードを使用すると、比較する2つのデータ・ソース・ノードに含まれるテキスト・データ内のセマンティック関連の計算を実行できます。
-
2つの入力データ・ソース。データ・ソースは、データ・ソース・ノードで接続されたレコードのデータ・フローか、ノード内でユーザーが入力した単一のレコード・データにすることができます。ユーザーが入力したデータの場合、入力データ・プロバイダは不要です。
-
1つの入力機能抽出モデルまたは明示的機能抽出モデル。ここで、モデルはセマンティック関連の計算用に選択できます。
データ・マイニング・モデルの詳細ビューの拡張
Oracle Data Miner のモデル・ビューアがOracle Data Miningでの変更を反映するように拡張されました。
モデル・ビューアの拡張機能は次のとおりです。
-
モデル内の計算済設定はモデル・ビューアの「設定」タブに表示されます。
-
新規ユーザーの埋込み変換ディクショナリ・ビューが「設定」の下にある「入力」タブと統合されます。
-
ビルド詳細データが「サマリー」の下にある「サマリー」タブに表示されます
-
クラスタ・モデル・ビューアでは、部分的な詳細を含むモデルを検出し、これを示すメッセージを表示します。これは、k-Meansモデル・ビューアおよび期待値の最大化モデル・ビューアにも適用されます。
列のフィルタ・ノードの拡張
Oracle Data Miningでは、教師なしの属性重要度ランキングをサポートしています。列の属性重要度ランキングが生成されますが、ターゲット列を選択する必要がありません。列のフィルタ・ノードでは、教師なしの属性重要度ランキングをサポートするように拡張されました。
マイニング・モデルの構築アラート
Oracle Data Miner では、モデル・ビューアおよびイベント・ログにモデル構築に関するアラートを記録します。
-
モデル・ビューア: 構築アラートが「アラート」タブに表示されます。
-
イベント・ログ: すべての構築アラートが、ジョブ名、ノード、サブ・ノード、時間およびメッセージなどの詳細情報とともに表示されます。
パーティション化されたモデルのサポート
Oracle Data Miner では、パーティション化されたモデルの構築およびテストをサポートしています。
-
構築ノード
-
適用ノード
-
テスト・ノード
Rビルド・モデル・ノード
Oracle Data Miningでは、Rモデル実装をOracle Data Miningフレームワーク内に追加する機能を提供しています。Rモデル統合をサポートするために、Oracle Data Miner は、分類、回帰、クラスタリングおよび機能抽出などのマイニング機能を備えた新規Rビルド・ノードとともに拡張されました。
集計ノードのDATEおよびTIMESTAMPデータ型のサポート
集計ノードがDATEおよびTIMESTAMPデータ型をサポートするように拡張されました。
DATEおよびTIMESTAMPデータ型の場合、使用可能な関数はCOUNT()、COUNT (DISTINCT())、MAX()、MEDIAN()、MIN()、STATS_MODE()
です。
構築ノードの拡張
すべての構築ノードは、研修データのサンプリングおよび数値データの準備をサポートするように拡張されました。
拡張は、すべての構築ノード・エディタの「サンプリング」タブに実装されています。デフォルトで、「サンプリング」オプションは「オフ」
に設定されています。「オン」
に設定すると、ユーザーはサンプルの行サイズを指定したり、システムで決定される設定を選択できます。
注意:
データ準備は、相関構築モデルではサポートされていません。-
異常検出ノードの編集
-
相関構築ノードの編集
-
分類構築ノードの編集
-
クラスタリング構築ノードの編集
-
明示的機能抽出構築ノードの編集
-
特徴抽出構築ノードの編集
-
回帰構築ノードの編集
JSON問合せノードの拡張
JSON問合せノードを使用すると、ARRAY、BOOLEAN、NUMBER
およびSTRING
などのデータ型を持つ属性に対してフィルタ条件を指定できます。
「すべて」
または「いずれか」
を使用して、データにフィルタを階層順に適用できます。ユーザーは、次のオプションのいずれかを使用して、リレーショナル・データ予測または集計定義(あるいはその両方)に使用するデータにフィルタを適用するかどうかを指定することもできます。
-
JSONネスト解除 — リレーショナル・データ形式で予測に使用するJSONデータにフィルタを適用します。
-
集計 — 集計に使用するJSONデータにフィルタを適用します。
-
JSONネスト解除および集計 - 両方にフィルタを適用します。
ポーリングのパフォーマンスの拡張
ポーリングのパフォーマンスおよびリソース使用状況機能が新しいユーザー・インタフェースで拡張されました。
-
ワークフロー・ステータスの自動問合せを使用するか、手動問合せを使用するかを決定するためのリポジトリ・プロパティ
POLLING_IDLE_ENABLED
が、追加されています。これは、「ワークフロー・ジョブ」および「スケジュール済ジョブ」ユーザー・インタフェースに適用されます。ただし、実行中のワークフローをモニターするときに、ワークフロー・エディタで自動的にポーリングが続行されます。注意:
POLLING_IDLE_ENABLED
をTRUE
に設定すると、ワークフロー・ステータスの自動問合せが設定されます。POLLING_IDLE_ENABLED
をFALSE
に設定すると、手動問合せが設定されます。新しいドッキング可能なウィンドウスケジュールされたワークフローが追加され、スケジュール済ジョブのリストが表示されます。これにより、ユーザーはスケジュール済ジョブを管理できます。
-
「ワークフロー・ジョブ」ウィンドウが次の新機能で拡張されています。
-
ワークフロー・ジョブの手動リフレッシュ。
-
Oracle Data Minerリポジトリ設定による自動更新の管理オーバーライド。
-
新規設定オプションによる「ワークフロー・ジョブ」プリファレンスへのアクセス。
-
テキスト設定の拡張
テキスト設定は、次の機能をサポートするように拡張されています。
-
シノニム(シソーラス)のテキストのサポート: Oracle Data Minerのテキストのマイニングは、シノニムをサポートしています。デフォルトでは、シソーラスはロードされません。ユーザーは、Oracle Textで提供されているデフォルトのシソーラスを手動でロードするか、独自のシソーラスをアップロードする必要があります。
-
「テキスト」タブに追加された新規設定:
-
トークンに必要な最小行(ドキュメント)数
-
すべての行(ドキュメント)のトークンの最大数
-
BIGRAM設定に追加された新規トークン:
-
BIGRAM:
ここで、NORMAL
トークンはバイグラムと混在しています -
STEM BIGRAM:
ここで、STEM
トークンが最初に抽出され、ステム・バイグラムが形成されます。
-
-
入力データ定義のリフレッシュ
ワークフローを(追加または削除された)新しい列で更新する場合、「入力データ定義のリフレッシュ」オプションを使用します。
SELECT*
機能と同等です。このオプションを使用すると、必要に応じて列を含めるか除外するためのワークフロー定義をすばやくリフレッシュできます。
注意:
「入力データ定義のリフレッシュ」オプションは、データ・ソース・ノードおよびSQL問合せノードでコンテキスト・メニュー・オプションとして使用できます。その他のデータ型のサポート
Oracle Data Miner では、次のデータ型の入力が、データ・ソース・ノードの列としておよびワークフロー内の計算済の新しい列として許可されます。
-
RAW
-
ROWID
-
UROWID
-
URITYPE
URITYPE
データ型は多数のサブ・タイプ・インスタンスを提供しており、これらもOracle Data Minerでサポートされています。これらを次に示します。
-
HTTPURITYPE
-
DBURITYPE
-
XDBURITYPE
インメモリー列のサポート
Oracle Data Minerでは、Oracle Database 12.2以上のインメモリー列ストア(IM列ストア)がサポートされています。インメモリー列ストアは、表およびパーティションのコピーを特殊な列形式で格納するために任意に使用できる静的SGAプールです。
Oracle Data Miner では、ワークフローでノードのインメモリー列をサポートするように拡張されました。インメモリー列設定のためのデータ圧縮方式および優先度レベルを設定するオプションが、「ノードのパフォーマンス設定の編集」ダイアログ・ボックスで使用できます。
ワークフロー・スケジューリングのサポート
Oracle Data Miner では、ワークフローを特定の日時に実行するようにスケジュールする機能をサポートしています。
スケジュール済ワークフローは表示のみに使用可能です。スケジュール済ワークフローを取り消すオプションを使用できます。スケジュール済ワークフローを取り消した後、ワークフローの編集および再スケジュールが可能になります。
ワークフローのステータス・ポーリングのパフォーマンスの改善
ワークフローのステータス・ポーリングのパフォーマンスが拡張されました。
この拡張には、新規リポジトリ・ビュー、リポジトリ・プロパティおよびユーザー・インタフェースの変更が含まれています。
-
リポジトリ・ビュー
ODMR_USER_WORKFLOW_ALL_POLL
が、ワークフロー・ステータスのポーリングに追加されています。 -
次のリポジトリ・プロパティが追加されています。
-
POLLING_IDLE_RATE:
実行中と検出されるワークフローが存在しない場合に、クライアントがデータベースをポーリングする比率を決定します。 -
POLLING_ACTIVE_RATE:
実行中と検出されるワークフローが存在する場合に、クライアントがデータベースをポーリングする比率を決定します。 -
POLLING_IDLE_ENABLED:
ワークフロー・ステータスの自動問合せを使用するか、手動問合せを使用するかを決定します。これは、「ワークフロー・ジョブ」および「スケジュール済ジョブ」ユーザー・インタフェースに適用されます。ただし、実行中のワークフローをモニターするときに、ワークフロー・エディタで自動的にポーリングが続行されます。注意:
POLLING_IDLE_ENABLED
をTRUE
に設定すると、ワークフロー・ステータスの自動問合せが設定されます。POLLING_IDLE_ENABLED
をFALSE
に設定すると、手動問合せが設定されます。 -
POLLING_COMPLETED_WINDOW:
ポーリング問合せ結果に完了したワークフローを含めるのに必要な時間を決定します。 -
PURGE_WORKFLOW_SCHEDULER_JOBS:
Data Minerワークフローの実行によって生成された古いOracle Schedulerオブジェクトをパージします。 -
PURGE_WORKFLOW_EVENT_LOG:
イベント・ログ内でワークフローごとにワークフローの実行を保持する数を制御します。制限内に維持されるように、古いワークフローのイベントをパージします。
-
-
新しいユーザー・インタフェースとして、「スケジュール済ジョブ」ウィンドウが追加されています。このウィンドウには、SQL Developer 18.2以降の「ツール」メニューと「表示」メニューの両方にある「Data Miner」オプションからアクセスできます。
拡張されたオブジェクト名のサポート
128バイトのスキーマ名、表名、列名およびシノニムのサポートが今後のOracle Databaseリリースで使用可能になります。Oracle Databaseをサポートするために、Oracle Data Minerリポジトリ・ビュー、表、XMLスキーマおよびPL/SQLパッケージが128バイトの名前をサポートするように拡張されています。
既知の問題および制限事項
このリリースの既知の問題と制限事項は次のとおりです。
-
「相関モデル構築」ノードは、「JSON問合せ」ノードから直接取得したデータを使用できません。
「表の作成」ノードを介して「JSON問合せ」ノードから取得したデータを永続化し、永続化したデータを「相関モデル構築」ノードの入力として使用する必要があります。
-
JSON集計が定義されている(「サブ・グループ化」あり)場合、分類ノードと回帰モデル構築ノードは、「JSON問合せ」ノードから直接取得したデータを使用できません。
「表の作成」ノードを介して「JSON問合せ」ノードから取得したデータを永続化し、永続化したデータをこれらの構築ノードの入力として使用する必要があります。
注意:
JSON集計が定義されていない(「サブ・グループ化」なし)場合、「ビルド」ノードは「JSON問合せ」ノードから直接取得したデータを使用できます。 -
JSONデータを問い合せるノードに「パラレル問合せ」を設定すると、ワークフローでランタイム・エラーが発生します。データベースの「パラレル問合せ」を「オン」に設定して実行すると、JSON問合せは失敗します。「ORA-12805: パラレル問合せサーバーが突然停止しました。」というエラー・メッセージが表示されます。
「パラレル問合せ」は、Oracle Data Minerを通じてノード・レベルで構成できます。-
「ノード」コンテキスト・メニューに、「パラレル問合せ」を設定するオプションがあります。「パラレル問合せ」をクリックしてノードを選択し、パラレル設定を構成します。
-
「データの表示」ビューアには、選択したデータ・ノードを問い合せるときに「パラレル問合せ」を
「オン」
に設定するオプションがあります。どちらの場合もエラーが発生し、同じエラー・メッセージが表示されます。
-
-
データベースの問題により、Oracle Database 12.1でOracle Data Minerを使用する場合はマルチバイト文字データがサポートされません。マルチバイトの問題に対処するためには、Oracle Database 12.1.0.2のパッチを適用してください。AL32UTF8キャラクタ・セットを使用することもお薦めします。
注意:
Oracle Database 12.1.0.2パッチは、Oracleサポートを通じてご請求ください。 -
Oracle Data Minerリポジトリをインストールする際に、エラー・メッセージが生成されますが、これは無視できます。このエラー・メッセージは、インストール時にロードされるデータベース・オブジェクトに関連するものです。すべてのデータベース・オブジェクトをインストールした後で、再コンパイルを完了します。無効なオブジェクトがある場合は、例外が発生します。スクリプトで例外が発生しない場合、Oracle Data Minerリポジトリのインストールは正常終了しています。
注意:
例外が生成されなければ、Oracle Data Miner 18.2以降のインストール時のこれらのエラー・メッセージは無視できます。
ドキュメントのアクセシビリティについて
Oracleのアクセシビリティについての詳細情報は、Oracle Accessibility ProgramのWebサイト(http://www.oracle.com/pls/topic/lookup?ctx=acc&id=docacc)を参照してください。
Oracle Supportへのアクセス
サポートを購入したオラクル社のお客様は、My Oracle Supportを介して電子的なサポートにアクセスできます。詳細情報は(http://www.oracle.com/pls/topic/lookup?ctx=acc&id=info)か、聴覚に障害のあるお客様は(http://www.oracle.com/pls/topic/lookup?ctx=acc&id=trs)を参照してください。
Oracle Data Minerリリース・ノート, リリース18.3
F13438-01
Copyright © 2016, 2018, Oracle and/or its affiliates. All rights reserved.
原本著者: Moitreyee Hazarika
原本協力著者: Denny Wong
このソフトウェアおよび関連ドキュメントの使用と開示は、ライセンス契約の制約条件に従うものとし、知的財産に関する法律により保護されています。ライセンス契約で明示的に許諾されている場合もしくは法律によって認められている場合を除き、形式、手段に関係なく、いかなる部分も使用、複写、複製、翻訳、放送、修正、ライセンス供与、送信、配布、発表、実行、公開または表示することはできません。このソフトウェアのリバース・エンジニアリング、逆アセンブル、逆コンパイルは互換性のために法律によって規定されている場合を除き、禁止されています。
ここに記載された情報は予告なしに変更される場合があります。また、誤りが無いことの保証はいたしかねます。誤りを見つけた場合は、オラクル社までご連絡ください。
このソフトウェアまたは関連ドキュメントを、米国政府機関もしくは米国政府機関に代わってこのソフトウェアまたは関連ドキュメントをライセンスされた者に提供する場合は、次の通知が適用されます。
U.S. GOVERNMENT END USERS: Oracle programs, including any operating system, integrated software, any programs installed on the hardware, and/or documentation, delivered to U.S. Government end users are \"commercial computer software\" pursuant to the applicable Federal Acquisition Regulation and agency-specific supplemental regulations.As such, use, duplication, disclosure, modification, and adaptation of the programs, including any operating system, integrated software, any programs installed on the hardware, and/or documentation, shall be subject to license terms and license restrictions applicable to the programs. No other rights are granted to the U.S. Government.
このソフトウェアもしくはハードウェアは様々な情報管理アプリケーションでの一般的な使用のために開発されたものです。このソフトウェアもしくはハードウェアは、危険が伴うアプリケーション(人的傷害を発生させる可能性があるアプリケーションを含む)への用途を目的として開発されていません。このソフトウェアもしくはハードウェアを危険が伴うアプリケーションで使用する際、安全に使用するために、適切な安全装置、バックアップ、冗長性(redundancy)、その他の対策を講じることは使用者の責任となります。このソフトウェアもしくはハードウェアを危険が伴うアプリケーションで使用したことに起因して損害が発生しても、オラクル社およびその関連会社は一切の責任を負いかねます。
OracleおよびJavaはOracle Corporationおよびその関連企業の登録商標です。その他の名称は、それぞれの所有者の商標または登録商標です。
Intel、Intel Xeonは、Intel Corporationの商標または登録商標です。すべてのSPARCの商標はライセンスをもとに使用し、SPARC International, Inc.の商標または登録商標です。AMD、Opteron、AMDロゴ、AMD Opteronロゴは、Advanced Micro Devices, Inc.の商標または登録商標です。UNIXは、The Open Groupの登録商標です。
このソフトウェアまたはハードウェア、そしてドキュメントは、第三者のコンテンツ、製品、サービスへのアクセス、あるいはそれらに関する情報を提供することがあります。お客様との間に適切な契約が定められている場合を除いて、オラクル社およびその関連会社は、第三者のコンテンツ、製品、サービスに関して一切の責任を負わず、いかなる保証もいたしません。お客様との間に適切な契約が定められている場合を除いて、オラクル社およびその関連会社は、第三者のコンテンツ、製品、サービスへのアクセスまたは使用によって損失、費用、あるいは損害が発生しても一切の責任を負いかねます。