Oracle® Data Miner

リリース・ノート

リリース4.2

E86925-01(原本部品番号:E64607-03)

2017年3月

Oracle Data Miner 4.2リリース・ノート

このドキュメントでは、最新の情報と、正規のマニュアルにはまだ記載されていない情報について説明します。

このドキュメントは次のトピックで構成されています。

Oracle Data Miner 4.2の新機能

Oracle Data Miner 4.2におけるOracle Data Minerの新機能は、次のとおりです。

Oracle Data Miningの機能
Oracle Data Minerの機能
Oracle Databaseの機能

Oracle Data Miningの機能

Oracle Data Miningの新機能は次のとおりです。

相関モデルの集計メトリック
アルゴリズム設定の拡張
明示的セマンティック分析アルゴリズムのサポート
データ・マイニング・モデルの詳細ビューの拡張
列のフィルタ・ノードの拡張
マイニング・モデルの構築アラート
Rビルド・モデル・ノード
パーティション化されたモデルのサポート

相関モデルの集計メトリック

Oracle Data Miner 4.2では拡張した相関ルール・アルゴリズムをサポートしており、これを使用すると、ユーザーは相関モデルを構築する前にアイテムをフィルタできます。

ユーザーは、相関構築ノード・エディタ、相関モデル・ビューアおよびモデル詳細ノード・エディタでフィルタを設定できます。

アルゴリズム設定の拡張

Oracle Data Miner 4.2は、パーティション・モデルの構築時のビルド設定、研修データのサンプリング、シフトおよびスケール変換などの数値データの準備を含むOracle Data Miningの拡張機能をサポートするように拡張されました。

注意:

これらの設定は、Oracle Data Miner 4.2がOracle Database 12.2に接続している場合に使用可能です。

アルゴリズムの変更は次のとおりです。

ディシジョン・ツリーのアルゴリズム設定の変更

最大監視対象ビンCLAS_MAX_SUP_BINSの設定がデシジョン・ツリー・アルゴリズムに追加されています。

期待値の最大化アルゴリズム設定の変更

「詳細のレベル」を設定すると、現在の設定「クラスタ統計の収集」が置き換わります。

使用される基礎となるアルゴリズム設定はEMCS_CLUSTER_STATISTICSです(値はAll=ENABLEおよびHierarchy=DISABLE)。追加された設定と非推奨になった設定があります。

追加された設定:

乱数シード
モデル検索
小さいコンポーネントの削除

非推奨になった設定:

概算 ODMS_APPROXIMATE_COMPUTATION

一般化線形モデルのアルゴリズム設定の変更

次の変更が一般化線形モデルのアルゴリズム設定に含まれています。変更は分類モデルと回帰モデルの両方に適用されます。

追加された設定:

収束許容値 GLMS_CONV_TOLERANCE
反復数 GLMS_NUM_ITERATIONS
バッチ行 GLMS_BATCH_ROWS
ソルバー GLMS_SOLVER
スパース・ソルバー GLMS_SPARSE_SOLVER

非推奨になった設定:

概算 ODMS_APPROXIMATE_COMPUTATION
カテゴリ型予測子の処理 GLMS_SELECT_BLOCK
機能識別のサンプリング GLMS_FTR_IDENTIFICATION
機能の受入れ GLMS_FTR_ACCEPTANCE

k-Meansアルゴリズム設定の変更

次の変更がk-Meansアルゴリズム設定に含まれています。

追加された設定:

詳細のレベル KMNS_DETAILS
乱数シード KMNS_RANDOM_SEEDS

非推奨になった設定:

増加係数

Support Vector Machineのアルゴリズム設定の変更

次の変更がSupport Vector Machineのアルゴリズム設定に含まれています。この変更は、線形カーネル関数とガウス・カーネル関数の両方に適用可能です。

追加された設定:

ソルバー SVMS_SOLVER
反復数 SVMS_NUM_ITERATIONS
拘束条件 SVMS_REGULARIZER
バッチ行 SVMS_BATCH_ROWS
ピボット数 SVMS_NUM_PIVOTS
注意:
ガウス・カーネル関数にのみ適用されます。

非推奨になった設定:

アクティブな学習
キャッシュ・サイズ SVMS_KERNEL_CACHE_SIZE
注意:
ガウス・カーネル関数にのみ適用されます。

単一値分解および主要コンポーネント分析アルゴリズム設定の変更

次の変更が単一値分解および主要コンポーネント分析アルゴリズムに含まれます。

追加された設定:

ソルバー SVDS_SOLVER
許容範囲 SVDS_TOLERANCE
乱数シード SVDS_RANDOM_SEED
オーバー・サンプリング SVDS_OVER_SAMPLING
べき乗法 SVDS_POWER_ITERATION

非推奨になった設定:

概算 ODMS_APPROXIMATE_COMPUTATION

明示的セマンティック分析アルゴリズムのサポート

Oracle Data Miner 4.2では、明示的セマンティック分析アルゴリズムと呼ばれる新機能の抽出アルゴリズムをサポートしています。

このアルゴリズムは、明示的機能抽出ノードと機能比較ノードの2つの新しいノードでサポートされています。

明示的機能抽出ノード

明示的機能抽出ノードは、明示的セマンティック分析アルゴリズムを使用して構築されます。

次のものに明示的機能抽出ノードを使用できます。

ドキュメント分類
情報の取得
セマンティックに関連する計算

機能比較ノード

機能比較ノードを使用すると、比較する2つのデータ・ソース・ノードに含まれるテキスト・データ内のセマンティック関連の計算を実行できます。

機能比較ノードの要件は次のとおりです。

2つの入力データ・ソース。データ・ソースは、データ・ソース・ノードで接続されたレコードのデータ・フローか、ノード内でユーザーが入力した単一のレコード・データにすることができます。ユーザーが入力したデータの場合、入力データ・プロバイダは不要です。
1つの入力機能抽出モデルまたは明示的機能抽出モデル。ここで、モデルはセマンティック関連の計算用に選択できます。

データ・マイニング・モデルの詳細ビューの拡張

Oracle Data Miner 4.2のモデル・ビューアがOracle Data Miningでの変更を反映するように拡張されました。

モデル・ビューアの拡張機能は次のとおりです。

モデル内の計算済設定はモデル・ビューアの「設定」タブに表示されます。
新規ユーザーの埋込み変換ディクショナリ・ビューが「設定」の下にある「入力」タブと統合されます。
ビルド詳細データが「サマリー」の下にある「サマリー」タブに表示されます
クラスタ・モデル・ビューアでは、部分的な詳細を含むモデルを検出し、これを示すメッセージを表示します。これは、k-Meansモデル・ビューアおよび期待値の最大化モデル・ビューアにも適用されます。

列のフィルタ・ノードの拡張

Oracle Data Miningでは、監視対象外の属性重要度ランキングをサポートしています。列の属性重要度ランキングが生成されますが、ターゲット列を選択する必要がありません。列のフィルタ・ノードでは、監視対象外の属性重要度ランキングをサポートするように拡張されました。

マイニング・モデルの構築アラート

Oracle Data Miner 4.2では、モデル・ビューアおよびイベント・ログにモデル構築に関するアラートを記録します。

モデルの構築後、Oracle Data MinerサーバーはOracle Data Miningにモデル構築関連のアラートを問い合せます。アラートは、ログに記録されます。

モデル・ビューア: 構築アラートが「アラート」タブに表示されます。
イベント・ログ: すべての構築アラートが、ジョブ名、ノード、サブ・ノード、時間およびメッセージなどの詳細情報とともに表示されます。

Rビルド・モデル・ノード

Oracle Data Miningでは、Rモデル実装をOracle Data Miningフレームワーク内に追加する機能を提供しています。Rモデル統合をサポートするために、Oracle Data Miner 4.2は、分類、回帰、クラスタリングおよび機能抽出などのマイニング機能を備えた新規Rビルド・ノードとともに拡張されました。

パーティション化されたモデルのサポート

Oracle Data Miner 4.2では、パーティション化されたモデルの構築およびテストをサポートしています。

次のモデルは、パーティション化されたモデルをサポートするように拡張されます。

構築ノード
適用ノード
テスト・ノード

Oracle Data Minerの機能

Oracle Data Minerの新機能は次のとおりです。

集計ノードのDATEおよびTIMESTAMPデータ型のサポート
JSON問合せノードの拡張
構築ノードの拡張
テキスト設定の拡張
入力データ定義のリフレッシュ
その他のデータ型のサポート
インメモリー列のサポート
ワークフロー・スケジューリングのサポート
ワークフローのステータス・ポーリングのパフォーマンスの改善

集計ノードのDATEおよびTIMESTAMPデータ型のサポート

集計ノードがDATEおよびTIMESTAMPデータ型をサポートするように拡張されました。

DATEおよびTIMESTAMPデータ型の場合、使用可能な関数はCOUNT()、COUNT (DISTINCT())、MAX()、MEDIAN()、MIN()、STATS_MODE()です。

JSON問合せノードの拡張

JSON問合せノードを使用すると、ARRAY、BOOLEAN、NUMBERおよびSTRINGなどのデータ型を持つ属性に対してフィルタ条件を指定できます。

ユーザーは、「フィルタ設定」ダイアログ・ボックスのオプション「すべて」または「いずれか」を使用して、データにフィルタを階層順に適用できます。ユーザーは、次のオプションのいずれかを使用して、リレーショナル・データ予測または集計定義(あるいはその両方)に使用するデータにフィルタを適用するかどうかを指定することもできます。

JSONネスト解除 — リレーショナル・データ形式で予測に使用するJSONデータにフィルタを適用します。
集計 — 集計に使用するJSONデータにフィルタを適用します。
JSONネスト解除および集計 - 両方にフィルタを適用します。

構築ノードの拡張

すべての構築ノードは、研修データのサンプリングおよび数値データの準備をサポートするように拡張されました。

拡張は、すべての構築ノード・エディタの「サンプリング」タブに実装されています。デフォルトで、「サンプリング」オプションは「オフ」に設定されています。「オン」に設定すると、ユーザーはサンプルの行サイズを指定したり、システムで決定される設定を選択できます。

注意:

データ準備は、相関構築モデルではサポートされていません。

「サンプリング」オプションが次の構築ノード・エディタで使用できます。

異常検出ノードの編集
相関構築ノードの編集
分類構築ノードの編集
クラスタリング構築ノードの編集
明示的機能抽出構築ノードの編集
特徴抽出構築ノードの編集
回帰構築ノードの編集

テキスト設定の拡張

テキスト設定は、次の機能をサポートするように拡張されています。

シノニム(シソーラス)のテキストのサポート: Oracle Data Minerのテキストのマイニングは、シノニムをサポートしています。デフォルトでは、シソーラスはロードされません。ユーザーは、Oracle Textで提供されているデフォルトのシソーラスを手動でロードするか、独自のシソーラスをアップロードする必要があります。
「テキスト」タブに追加された新規設定:
- トークンに必要な最小行(ドキュメント)数
- すべての行(ドキュメント)のトークンの最大数
- BIGRAM設定に追加された新規トークン:
  - BIGRAM: ここで、NORMALトークンはバイグラムと混在しています
  - STEM BIGRAM: ここで、STEMトークンが最初に抽出され、ステム・バイグラムが形成されます。

入力データ定義のリフレッシュ

ワークフローを(追加または削除された)新しい列で更新する場合、「入力データ定義のリフレッシュ」オプションを使用します。

「入力データ定義のリフレッシュ」オプションは、入力ソースのSELECT*機能と同等です。このオプションを使用すると、必要に応じて列を含めるか除外するためのワークフロー定義をすばやくリフレッシュできます。

注意:

「入力データ定義のリフレッシュ」オプションは、データ・ソース・ノードおよびSQL問合せノードでコンテキスト・メニュー・オプションとして使用できます。

その他のデータ型のサポート

Oracle Data Miner 4.2では、次のデータ型の入力が、データ・ソース・ノードの列としておよびワークフロー内の計算済の新しい列として許可されます。

RAW
ROWID
UROWID
URITYPE

URITYPEデータ型は多数のサブ・タイプ・インスタンスを提供しており、これらもOracle Data Miner 4.2でサポートされています。これらを次に示します。

HTTPURITYPE
DBURITYPE
XDBURITYPE

インメモリー列のサポート

Oracle Data Minerでは、Oracle Database 12.1.0.2以降のインメモリー列ストア(IM列ストア)をサポートしています。これは、特別な列型フォーマットで表およびパーティションのコピーを格納するオプションの静的SGAプールです。

Oracle Data Miner 4.2では、ワークフローでノードのインメモリー列をサポートするように拡張されました。インメモリー列設定のためのデータ圧縮方式および優先度レベルを設定するオプションが、「ノードのパフォーマンス設定の編集」ダイアログ・ボックスで使用できます。

ワークフロー・スケジューリングのサポート

Oracle Data Miner 4.2では、ワークフローを特定の日時に実行するようにスケジュールする機能をサポートしています。

スケジュール済ワークフローは表示のみに使用可能です。スケジュール済ワークフローを取り消すオプションを使用できます。スケジュール済ワークフローを取り消した後、ワークフローの編集および再スケジュールが可能になります。

ポーリングのパフォーマンスの拡張

ポーリングのパフォーマンスおよびリソース使用状況機能が新しいユーザー・インタフェースで拡張されました。

この拡張は、次の機能でサポートされています。

ワークフロー・ステータスの自動問合せを使用するか、手動問合せを使用するかを決定するためのリポジトリ・プロパティPOLLING_IDLE_ENABLEDが、追加されています。これは、「ワークフロー・ジョブ」および「スケジュール済ジョブ」ユーザー・インタフェースに適用されます。ただし、実行中のワークフローをモニターするときに、ワークフロー・エディタで自動的にポーリングが続行されます。
注意:
POLLING_IDLE_ENABLEDをTRUEに設定すると、ワークフロー・ステータスの自動問合せが設定されます。POLLING_IDLE_ENABLEDをFALSEに設定すると、手動問合せが設定されます。

新しいドッキング可能なウィンドウスケジュールされたワークフローが追加され、スケジュール済ジョブのリストが表示されます。これにより、ユーザーはスケジュール済ジョブを管理できます。
「ワークフロー・ジョブ」ウィンドウが次の新機能で拡張されています。
- ワークフロー・ジョブの手動リフレッシュ。
- Oracle Data Minerリポジトリ設定による自動更新の管理オーバーライド。
- 新規設定オプションによる「ワークフロー・ジョブ」プリファレンスへのアクセス。

ワークフローのステータス・ポーリングのパフォーマンスの改善

ワークフローのステータス・ポーリングのパフォーマンスが拡張されました。

この拡張には、新規リポジトリ・ビュー、リポジトリ・プロパティおよびユーザー・インタフェースの変更が含まれています。

リポジトリ・ビューODMR_USER_WORKFLOW_ALL_POLLが、ワークフロー・ステータスのポーリングに追加されています。
次のリポジトリ・プロパティが追加されています。
- POLLING_IDLE_RATE: 実行中と検出されるワークフローが存在しない場合に、クライアントがデータベースをポーリングする比率を決定します。
- POLLING_ACTIVE_RATE: 実行中と検出されるワークフローが存在する場合に、クライアントがデータベースをポーリングする比率を決定します。
- POLLING_IDLE_ENABLED: ワークフロー・ステータスの自動問合せを使用するか、手動問合せを使用するかを決定します。これは、「ワークフロー・ジョブ」および「スケジュール済ジョブ」ユーザー・インタフェースに適用されます。ただし、実行中のワークフローをモニターするときに、ワークフロー・エディタで自動的にポーリングが続行されます。
  注意:
  POLLING_IDLE_ENABLEDをTRUEに設定すると、ワークフロー・ステータスの自動問合せが設定されます。POLLING_IDLE_ENABLEDをFALSEに設定すると、手動問合せが設定されます。
- POLLING_COMPLETED_WINDOW: ポーリング問合せ結果に完了したワークフローを含めるのに必要な時間を決定します。
- PURGE_WORKFLOW_SCHEDULER_JOBS: Data Minerワークフローの実行によって生成された古いOracle Schedulerオブジェクトをパージします。
- PURGE_WORKFLOW_EVENT_LOG: イベント・ログ内でワークフローごとにワークフローの実行を保持する数を制御します。制限内に維持されるように、古いワークフローのイベントをパージします。
新規ユーザー・インタフェースには「スケジュール済ジョブ」ウィンドウが含まれています。これを使用すると、SQL Developer 4.2の「ツール」メニューと「ビュー」メニューの両方の「Data Miner」オプションからアクセスできます。

Oracle Databaseの機能

Oracle Databaseの新機能は、「拡張されたオブジェクト名のサポート」に記載しています。

拡張されたオブジェクト名のサポート

128バイトのスキーマ名、表名、列名およびシノニムのサポートが今後のOracle Databaseリリースで使用可能になります。Oracle Databaseをサポートするために、Oracle Data Minerリポジトリ・ビュー、表、XMLスキーマおよびPL/SQLパッケージが128バイトの名前をサポートするように拡張されています。

サポートされているプラットフォーム

サポートされるプラットフォームの詳細は、『Oracle SQL Developerインストレーション・ガイド』を参照してください。

Oracle Data Miner 4.2の前提条件

Oracle Data Miner 4.2を使用する前に、次の点を確認してください。

システムにSQL Developer 4.2をインストールします。
Oracle Databaseへのセキュアなアクセス:
- 最小バージョン: Oracle Database 11.2.0.4 Enterprise Edition、Data Miningオプション付き。
- 優先バージョン: Oracle Database 12.2 Enterprise Edition。
データ・マイニング用のデータベース・ユーザー・アカウントを作成します。
SQL Developerで、Oracle Data Minerユーザーに対するデータベース接続を作成します。
Oracle Data Minerリポジトリをインストールします。
注意:
SHサンプル・スキーマは、Oracle Database 12.2に同梱されていません。サンプル・スキーマをインストールするには、https://github.com/oracle/db-sample-schemasに移動します。

既知の問題および制限事項

このリリースの既知の問題と制限事項は次のとおりです。

「相関モデル構築」ノードは、「JSON問合せ」ノードから直接取得したデータを使用できません。

「表の作成」ノードを介して「JSON問合せ」ノードから取得したデータを永続化し、永続化したデータを「相関モデル構築」ノードの入力として使用する必要があります。
JSON集計が定義されている(「サブ・グループ化」あり)場合、分類ノードと回帰モデル構築ノードは、「JSON問合せ」ノードから直接取得したデータを使用できません。

「表の作成」ノードを介して「JSON問合せ」ノードから取得したデータを永続化し、永続化したデータをこれらの構築ノードの入力として使用する必要があります。

注意:
JSON集計が定義されていない（「サブ・グループ化」なし）場合、「ビルド」ノードは「JSON問合せ」ノードから直接取得したデータを使用できます。
JSONデータを問い合せるノードに「パラレル問合せ」を設定すると、ワークフローでランタイム・エラーが発生します。データベースの「パラレル問合せ」を「オン」に設定して実行すると、JSON問合せは失敗します。「ORA-12805: パラレル問合せサーバーが突然停止しました。」というエラー・メッセージが表示されます。
「パラレル問合せ」は、Oracle Data Minerを通じてノード・レベルで構成できます。
- 「ノード」コンテキスト・メニューに、「パラレル問合せ」を設定するオプションがあります。「パラレル問合せ」をクリックしてノードを選択し、パラレル設定を構成します。
- 「データの表示」ビューアには、選択したデータ・ノードを問い合せるときに「パラレル問合せ」を「オン」に設定するオプションがあります。
  
  どちらの場合もエラーが発生し、同じエラー・メッセージが表示されます。
データベースの問題により、Oracle Database 12.1でOracle Data Minerを使用する場合はマルチバイト文字データがサポートされません。マルチバイトの問題に対処するためには、Oracle Database 12.1.0.2のパッチを適用してください。AL32UTF8キャラクタ・セットを使用することもお薦めします。
注意:
Oracle Database 12.1.0.2パッチは、Oracleサポートを通じてご請求ください。
Oracle Data Minerリポジトリをインストールする際に、エラー・メッセージが生成されますが、これは無視できます。このエラー・メッセージは、インストール時にロードされるデータベース・オブジェクトに関連するものです。すべてのデータベース・オブジェクトをインストールした後で、再コンパイルを完了します。無効なオブジェクトがある場合は、例外が発生します。スクリプトで例外が発生しない場合、Oracle Data Minerリポジトリのインストールは正常終了しています。
注意:
例外が生成されなければ、Oracle Data Miner 4.2インストール時のこれらのエラー・メッセージは無視できます。

バグの修正

Oracle Data Miner 4.2では、122個のバグが修正されています。

ドキュメントのアクセシビリティについて

Oracleのアクセシビリティについての詳細情報は、Oracle Accessibility ProgramのWebサイト(http://www.oracle.com/pls/topic/lookup?ctx=acc&id=docacc)を参照してください。

Oracle Supportへのアクセス

サポートを購入したオラクル社のお客様は、My Oracle Supportを介して電子的なサポートにアクセスできます。詳細情報は(http://www.oracle.com/pls/topic/lookup?ctx=acc&id=info)か、聴覚に障害のあるお客様は(http://www.oracle.com/pls/topic/lookup?ctx=acc&id=trs)を参照してください。

Oracle® Data Minerリリース・ノート, リリース4.2

E86925-01

このソフトウェアおよび関連ドキュメントの使用と開示は、ライセンス契約の制約条件に従うものとし、知的財産に関する法律により保護されています。ライセンス契約で明示的に許諾されている場合もしくは法律によって認められている場合を除き、形式、手段に関係なく、いかなる部分も使用、複写、複製、翻訳、放送、修正、ライセンス供与、送信、配布、発表、実行、公開または表示することはできません。このソフトウェアのリバース・エンジニアリング、逆アセンブル、逆コンパイルは互換性のために法律によって規定されている場合を除き、禁止されています。

ここに記載された情報は予告なしに変更される場合があります。また、誤りが無いことの保証はいたしかねます。誤りを見つけた場合は、オラクル社までご連絡ください。

このソフトウェアまたは関連ドキュメントを、米国政府機関もしくは米国政府機関に代わってこのソフトウェアまたは関連ドキュメントをライセンスされた者に提供する場合は、次の通知が適用されます。

U.S. GOVERNMENT END USERS: Oracle programs, including any operating system, integrated software, any programs installed on the hardware, and/or documentation, delivered to U.S. Government end users are "commercial computer software" pursuant to the applicable Federal Acquisition Regulation and agency-specific supplemental regulations.As such, use, duplication, disclosure, modification, and adaptation of the programs, including any operating system, integrated software, any programs installed on the hardware, and/or documentation, shall be subject to license terms and license restrictions applicable to the programs.No other rights are granted to the U.S. Government.

このソフトウェアもしくはハードウェアは様々な情報管理アプリケーションでの一般的な使用のために開発されたものです。このソフトウェアもしくはハードウェアは、危険が伴うアプリケーション(人的傷害を発生させる可能性があるアプリケーションを含む)への用途を目的として開発されていません。このソフトウェアもしくはハードウェアを危険が伴うアプリケーションで使用する際、安全に使用するために、適切な安全装置、バックアップ、冗長性(redundancy)、その他の対策を講じることは使用者の責任となります。このソフトウェアもしくはハードウェアを危険が伴うアプリケーションで使用したことに起因して損害が発生しても、オラクル社およびその関連会社は一切の責任を負いかねます。

OracleおよびJavaはOracle Corporationおよびその関連企業の登録商標です。その他の名称は、それぞれの所有者の商標または登録商標です。

Intel、Intel Xeonは、Intel Corporationの商標または登録商標です。すべてのSPARCの商標はライセンスをもとに使用し、SPARC International, Inc.の商標または登録商標です。AMD、Opteron、AMDロゴ、AMD Opteronロゴは、Advanced Micro Devices, Inc.の商標または登録商標です。UNIXは、The Open Groupの登録商標です。

このソフトウェアまたはハードウェア、そしてドキュメントは、第三者のコンテンツ、製品、サービスへのアクセス、あるいはそれらに関する情報を提供することがあります。お客様との間に適切な契約が定められている場合を除いて、オラクル社およびその関連会社は、第三者のコンテンツ、製品、サービスに関して一切の責任を負わず、いかなる保証もいたしません。お客様との間に適切な契約が定められている場合を除いて、オラクル社およびその関連会社は、第三者のコンテンツ、製品、サービスへのアクセスまたは使用によって損失、費用、あるいは損害が発生しても一切の責任を負いかねます。