データ・ノードでは、マイニング操作用のデータを指定し、データを変換するか、データを表に保存します。Oracle Data Mining操作の入力は、Oracle Databaseの表やビュー、またはデータ・フローの一部であるOracle Data Minerノードです。
データ・ノードは、「コンポーネント」ペインの「データ」セクションで使用できます。次のデータ・ノードでは、ワークフロー内のデータを指定し、表を作成および変更できます。
「自動」
です。表またはビュー作成ノードは、接続しているスキーマの表に結果を保存できるタイプのノードです。
たとえば、表またはビュー作成ノードを使用して、適用ノードの結果を表に保存します。表作成ノードでは、可能な場合は圧縮が自動的に使用されます。表作成ノードはパラレルに実行できます。
表またはビュー作成ノードの利点は、次のとおりです。
データの永続性: 表またはビュー作成ノードでは、データベースのビューまたは表としてノードに入るデータを保存します。表を作成すると、実際のデータが永続化されます。ビューを作成すると、SQL定義(完全系統)が永続化されます。このノードからの出力は、ビューまたは表で提供されたデータです。
パフォーマンスの向上: 「結合」や「集計」などの複雑な変換を1つ以上実行し、変換の結果を表として保存すると、それ以降の操作が高速化されます。たとえば、「集計」と「結合」を実行し、この変換結果が含まれる表を作成して、その表をモデル作成用の入力として使用できます。したがって、表は結合ノードから作成します。分類モデルは、この表に対して作成されます。
関連項目
表またはビュー作成ノードを使用して実行できるタスクをリストします。
表またはビュー作成ノードを作成して、データ・フローを表またはビューに保存します。
表またはビュー作成ノードを、データ・フローを作成する任意のノード(適用ノードなど)に接続できます。表またはビュー作成ノードを作成するには、次の手順を実行します。
Oracle Data Minerは、表作成ノードに表を作成し、分類および回帰モデル構築でのテスト用の分割データ・セットを作成します。
Oracle Data Minerは、表の作成時に、ネストされた列DM_NESTED_
*がデータに含まれていないと判断すると、圧縮を使用して表を作成します。
表を圧縮すると次の利点があります。
ディスク領域の節約
バッファ・キャッシュでのメモリー使用の削減
読取り中の問合せの実行速度の増加
Oracle Data Minerは、表作成ノードについて、主キーが定義されていないこと、および索引が定義されていないことも確認します。
「表またはビュー作成ノードの編集」ダイアログ・ボックスで、表またはビュー作成ノードの操作を変更できます。
表またはビュー作成ノードを編集するには、次の手順を実行します。
関連項目
「ストレージ設定の編集」ダイアログ・ボックスで、ロギング設定およびデータ圧縮方法を設定できます。
ロギング設定およびデータ圧縮方法を編集するには、次の手順を実行します。
パラレル処理設定の一部として指定されたその他すべての設定をオーバーライドするには、ログ・オンを選択します。
「圧縮レベル」セクションで、次のいずれかのオプションを選択して、データ圧縮方法を設定します。
なし: この方法では、データは圧縮されません。
低: この方法では、最も優れた問合せパフォーマンスが得られます。
中: この方法では、データがDML操作用に最適化され、IM列が圧縮されます
高: この方法では、優れた問合せパフォーマンスが得られます。
より高い: この方法では、良好な問合せパフォーマンスが得られます。
最高: この方法では、平均的な問合せパフォーマンスが得られます。
デフォルトでは、すべての列が選択されています。「表またはビューの作成」の定義を完了するには、少なくとも1つの属性を選択する必要があります。
次のタスクを実行できます。
列の削除: 「選択した属性」セクション内の属性を選択し、それを「使用可能な属性」セクションに移動します。「OK」をクリックします。
列の追加: 「使用可能な属性」セクション内の属性を選択し、それを「選択された属性」セクションに移動します。「OK」をクリックします。
データ・ソース・ノード・ビューアで、ノードのデータを表示できます。
ノードが正常に実行された後に、ノードを右クリックして、「データの表示」を選択します。データがデータ・ソース・ノード・ビューアに表示されます。
関連項目
コンテキスト・メニューのオプションは、ノードのタイプによって異なります。様々なタスクを実行したり、ノードに関する情報を表示するためのショートカットが用意されています。
次のタスクを実行できます。
関連項目
ワークフローを構成するノードに指定されているタスクを実行するには、「実行」オプションを使用します。
Data Minerサーバーは、非同期的にワークフローを実行します。クライアントを接続する必要はありません。ワークフローの1つ以上のノードを実行できます。
1つのノードを実行する場合: ノードを右クリックして、「実行」を選択します。
複数のノードを同時に実行する場合: [Ctrl]キーを押しながら個々のノードをクリックして、ノードを選択します。選択したノードを右クリックして、「実行」を選択します。
ノードが1つ以上の親ノードの出力に依存する場合、実行中のノードに必要な出力がない場合にのみ親ノードが自動的に実行されます。
完了している1つ以上のノードを再実行するには、「実行の強制」オプションを使用します。
「実行の強制」は、モデルをもう一度構築する前に、既存のモデルを削除します。
複数のノードを選択するには、[Ctrl]
キーを押しながらノードをクリックします。
ワークフローの任意の場所で、ノードの「実行の強制」を使用できます。ワークフロー内のノードの場所に応じて、「実行の強制」を使用してノードを実行するための次の選択肢があります。
選択されたノード
選択されたノードと子
(ノードに子ノードがある場合に使用可能)
子ノードのみ
(ノードに1つ以上の子ノードがある場合に使用可能)
選択されたノードと親
(ノードに親ノードがある場合に使用可能)
「スケジュールの作成」オプションを使用して、ワークフローが所定の日時に実行されるようにスケジュールを定義します。
ワークフロー・スケジュールの設定を保存するには、をクリックします。スケジュールの保存ダイアログ・ボックスで、スケジュールの名前を指定できます。
ノードのデフォルト設定を編集するには、「編集」オプションを使用します。
ノードには、デフォルトのアルゴリズムおよび設定があります。ノードを編集する場合は、デフォルトのアルゴリズムおよび設定を変更します。次の方法のいずれかで、ノードを編集できます。
「編集」ダイアログ・ボックスを使用したノードの編集
プロパティUIによるノードの編集
データ・ノードに含まれているデータを表示するには、「データの表示」オプションを使用します。
データ・ノードとは、表またはビュー作成ノード、データ・ソース・ノード、データの参照ノード、グラフ・ノード、SQL問合せノードおよび表更新ノードです。
関連項目
ワークフローを実行して構築したモデルの詳細を表示するには、「モデルの表示」オプションを使用します。
モデルを表示するには、リストからモデルを選択してモデル・ビューアを開く必要があります。表示する前に、モデルが正常に作成されている必要があります。
変換を実行するノードの仕様を含む新しいノードを作成するには、「適用チェーンの生成」を使用します。
手順で実行される変換が複数ある場合(たとえばサンプル
の後にカスタム変換
が続く場合など)、手順での変換ごとに「適用チェーンの生成」を選択する必要があります。個々のノードを接続し、それらを適切なデータ・ソースに接続する必要があります。
「適用チェーンの生成」によって、新しいデータが既存のデータと同じ方法で準備されていることを確認するために使用できる変換手順を作成できます。たとえば、適用データが構築データと同じ方法で準備されていることを確認するには、このオプションを使用します。
「適用チェーンの生成」オプションは、すべてのノードに有効なわけではありません。たとえば、構築ノードの仕様はコピーされません。
新しい列の追加または列の削除をワークフローに反映するには、「入力データ定義のリフレッシュ」オプションを使用します。
SELECT*
機能と同等です。このオプションを使用すると、ワークフロー定義をすばやくリフレッシュして、該当する列を含めたり、除外できます。注意:
「入力データ定義のリフレッシュ」オプションは、データ・ソース・ノードおよびSQL問合せノードのコンテキスト・メニュー・オプションとして使用できます。現在の接続で発生したイベントに関する情報(エラー、警告および情報メッセージ)を表示するには、「イベント・ログの表示」オプションを使用します。
「イベント・ログの表示」オプションをクリックすると、イベント・ログの表示ダイアログ・ボックスが開きます。
関連項目
ワークフローに指定されているタスクを実行するSQLスクリプトを作成することによって、ノードまたはワークフローをデプロイするには、「デプロイ」オプションを使用します。
「デプロイ」
によって生成されたスクリプトはディレクトリに保存されます。
注意:
デプロイする前にノードを実行する必要があります。
ワークフロー全体の動作をレプリケートするスクリプトを生成できます。このようなスクリプトは、アプリケーション統合の基礎として、またはData Minerリポジトリとワークフローをターゲットおよび本番システムにインストールする方法よりも軽量のデプロイメントとして機能します。
ワークフローまたはワークフローの一部をデプロイするには、次の手順を実行します。
選択したオブジェクト(ノードまたは接続)を削除するには、「切取り」オプションを使用します。
または、オブジェクトを選択して、キーボードの[Delete]を押すことによってオブジェクトを削除することもできます。
1つ以上のノードをコピーして、同じワークフローまたは別のワークフローに貼り付けるには、「コピー」オプションを使用します。
ノードをコピーして貼り付けるには、次の手順を実行します。
注意:
ノードのコピーおよび貼付けでは、元のノードのマイニング・モデルまたは結果は維持されません。
コピーしたオブジェクトをワークフローに貼り付けるには、「貼付け」オプションを使用します。
オブジェクトを貼り付けるには、ワークフローを右クリックして、「貼付け」をクリックします。または、[Ctrl]を押しながら[V]を押します。
注意:
ノード名およびモデル名は、名前の衝突を避けるために変更されます。名前を維持するには、「拡張貼付け」オプションを使用します。
ノードやモデルを貼り付けるときにそれらの名前を保持するには、「拡張貼付け」オプションを使用します。
貼付けのデフォルトの動作では、名前の衝突を避けるためにノード名およびモデル名が変更されます。
「拡張貼付け」オプションに移動するには、ワークフローを右クリックして、「拡張貼付け」をクリックします。または、[Ctrl]を押しながら[Shift]と[V]を押します。
注意:
モデル名が一意ではない場合、再作成されるときにモデルがオーバーライドされることがあります。
関連項目
ノードのパラレル設定およびインメモリー設定を編集するには、「パフォーマンス設定」オプションを使用します。
コンテキスト・メニューで「パフォーマンス設定」をクリックするか、ワークフローのツールバーで「パフォーマンス・オプション」をクリックすると、「選択したノードの設定の編集」ダイアログ・ボックスが開きます。ここには、ワークフローを構成するすべてのノードがリストされます。「選択したノードの設定の編集」ダイアログ・ボックスで設定を編集するには、次の手順を実行します。
「パラレル設定」をクリックして、次のいずれかを選択します。
有効化: ワークフロー内の選択したノードに対してパラレル設定を有効にします。
無効化: ワークフロー内の選択したノードに対してパラレル設定を無効にします。
すべて: ワークフロー内のすべてのノードに対してパラレル処理を有効にします。
なし: ワークフロー内のすべてのノードに対してパラレル処理を無効にします。
「インメモリー設定」をクリックして、次のいずれかを選択します。
有効化: ワークフロー内の選択したノードに対してインメモリー設定を有効にします。
無効化: ワークフロー内の選択したノードに対してインメモリー設定を無効にします。
すべて: ワークフロー内の選択したノードに対してインメモリー設定を有効にします。
なし: ワークフロー内のすべてのノードに対してインメモリー設定を無効にします
をクリックして、「ノードのパフォーマンス設定の編集」ダイアログ・ボックスで「並列度」を設定したり、「圧縮方法」や「優先度レベル」などのインメモリー設定を指定します。
少なくとも1つのノードのパラレル設定を指定すると、次の表示がワークフローのタイトル・バーに示されます。
パフォーマンス設定は、選択したノードに対してオン、すべてのノードに対してオン、またはオフのいずれかになります。「パフォーマンス・オプション」をクリックすると、「選択したノードの設定の編集」ダイアログ・ボックスが開きます。
をクリックして、パラレル処理のデフォルト・プリファレンスを編集します。
ノードのデフォルト設定の編集: 「パフォーマンス・オプション」ダイアログ・ボックスでは、選択したノードのパラレル設定およびインメモリー設定を編集できます。SQL Developerの「ツール」メニューにある「プリファレンス」オプションから「パフォーマンス・オプション」ダイアログ・ボックスにアクセスできます。
デフォルト設定の変更
コンテキスト・メニューからツールバーのアクションを選択するには、「ツールバー・アクション」オプションを使用します。
現在のアクションは、「ズームイン」および「ズームアウト」です。
ランタイムのノード障害に関するエラーを表示するには、「ランタイム・エラーの表示」を使用します。このオプションは、実行時にノードの実行が失敗した場合にのみ表示されます。
イベント・ログが開き、エラーのリストが表示されます。エラーを選択すると、正確なメッセージと詳細が表示されます。
関連項目
検証エラー(発生した場合)を表示するには、「検証エラーの表示」オプションを使用します。
このオプションは、検証エラーがある場合にのみ表示されます。たとえば、相関ノードがデータ・ソース・ノードに接続されていない場合、「検証エラーの表示」を選択すると、「ビルド・データ入力ノードが接続されていません」
という検証エラーが表示されます。
または、マウスをノード上に移動することによって検証エラーを表示することもできます。エラーは、ツールチップに表示されます。
現在のノードのすべての親ノードを検証するには、「親の検証」オプションを使用します。
ノードの親ノードを検証するには、ノードを右クリックして、「親の検証」 を選択します。
ノードが「準備完了」、「完了」
および「エラー」
状態の場合は、親ノードを検証できます。すべての親ノードは、完了済の状態である必要があります。
正常に構築されたモデルのテスト結果を表示して比較するには、「テスト結果の比較」オプションを使用します。
分類モデルおよび回帰モデルについて、このオプションは、問題解決に最適なモデルを選択できるように、正常に作成されたすべてのモデルのテスト結果を表示します。
「プロパティ」ペインで、ノードの特性やプロパティを調査および変更できます。
「プロパティ」ペインで、表またはビューの作成ノードを管理するには、次の手順を実行します。
「表」には、表またはビューの名前が表示されます。
次のタスクを実行できます。
表またはビューの名前を変更: 表のデフォルト名を変更した場合、ノードの名前はその表の名前に一致するように変更されます。たとえば、表のデフォルト名をPREDICTIONS
に変更した場合、表またはビューの作成ノードの名前もPREDICTIONS
に変更されます。
オブジェクト・タイプを表からビューに変更: デフォルトのタイプは「表」
です。ビューを作成するには、「ビュー」をクリックします。
「列」には、表の列が表示されます。
デフォルト設定では自動動作が可能です。「自動入力列の選択」の選択を解除すると、表内の列を手動で選択および編集できます。次の操作を実行できます。
列の削除: 削除する列を選択し、をクリックします。
列の編集: 列を選択し、をクリックします。必要な変更の編集を次で実行します。
「列の選択」ダイアログ・ボックス
JSONデータの場合は「データ・ガイドの編集」ダイアログ・ボックス
関連項目
「自動入力列の選択」オプションを選択すると、特定のシナリオに応じて、ノード内の列が自動的に追加または削除されます。
「自動入力列の選択」が選択されている場合、次のシナリオが考えられます。
シナリオ1: 入力が接続されている場合、入力ノードのすべての列が選択されます。ノードは有効になります。少なくとも1つの列が指定に含まれていることを前提とします。
シナリオ2: 入力が切断されている場合、すべての列が自動的に削除されます。ノードは無効になります。
シナリオ3: 入力ノードが編集されている場合、次の編集シナリオが考えられます。
列の追加: 互換性がある場合は、表またはビュー作成ノードに列が追加されます。
列の削除: 表またはビュー作成ノードから列が削除されます。
列の編集: 列が編集されている場合、列のデータ型の変更により、ノードで無効な状態がトリガーされる可能性があります。
注意:
「自動入力列の選択」オプションの選択が解除されている場合は、表またはビュー作成ノードに対して列指定を手動で追加および削除する必要があります。
データ・ソース・ノードでは、ワークフローのソース・データを定義します。たとえば、データ・ソース・ノードで、モデルの構築データを指定します。
ユーザーがアクセスできる表またはビューはすべて、ソースとして選択できます。このノードでは、入力ノードの接続が許可されません。データ・ソース・ノードは、データベース・リソースを使用して、自身を定義します。データベース・リソースが変更された場合は、ノード定義のリフレッシュが必要になることがあります。たとえば、リソースが削除または再作成された場合です。
データ・ソース・ノードはパラレルに実行できます。
データ・ソース・ノードでは、特定のデータ型のみが許可されています。他のデータ型を持つ列は除外されます。
関連項目
基本的なOracleデータ型のほとんどが、データ・ソース・ノードでサポートされています。
オブジェクト・ベースのデータ型を含めることはできますが、各オブジェクト・タイプをよく理解する必要があります。オブジェクト・データ型では、オブジェクト階層の適切なレベルで記憶域句を定義する必要があります。
VARCHAR2
CHAR
FLOAT
NUMBER
CLOB
NESTED_NUMERICALS
NESTED_CATEGORICALS
次のデータ型は、Oracle Data Mining 12cリリース1 (12.1)以降でサポートされています。
BINARY_DOUBLE
BINARY_FLOAT
DM_NESTED_BINARY_DOUBLES
DM_NESTED_BINARY_DOUBLES
BLOB
(テキストの場合のみ)
Oracle Data Mining 12cリリース1以降に接続されている場合、BINARY
データ型とBLOB
はOracle Data Minerでサポートされます。
次の日時データ型は、部分的にサポートされています。
DATE
TIMESTAMP
TIMESTAMP_WITH_LOCAL_TIMEZONE
TIMESTAMP_WITH_TIMEZONE
TIMESTAMP_WITH_LOCAL_TIMEZONE
Oracle Database 12.1.0.2では、次のデータ型のJSONデータがサポートされています。Oracle Data Minerは、次のデータ型から擬似JSON データ型を導出します。
VARCHAR2
CLOB
BLOB
RAW
NCLOB
NVARCHAR2
RAW
ROWID
UROWID
URITYPE
。URITYPE
データ型では、多数のサブ・タイプ・インスタンスが提供され、これらはOracle Data Miner 18.1でもサポートされています。これらを次に示します。HTTPURITYPE
DBURITYPE
XDBURITYPE
関連項目
日時データ型は、Oracle Data Minerの他の関数では使用できません。特に、日時データ型は、モデル構築のターゲットにすることはできません。
「変換」を使用した変換では、DATE
、TIMESTAMP
、TIMESTAMP_WITH_LOCAL_TIMEZONE
およびTIMESTAMP_WITH_TIMEZONE
の日時データ型を部分的にサポートしています。
日時データ型を持つ属性は、「等幅」または「カスタム」ビニングを使用してビニングできます。
「統計」または「値」の欠損値処理を、日時データ型を持つ属性に適用できます。
日時型を持つ属性は、データの参照ノードによって分析されます。
データ・ソース・ノードを使用して実行できるタスクをリストします。
ワークフローを作成した後に、データ・ソース・ノードを作成します。
データ・ソース・ノードを作成し、データをアタッチするには、次の手順を実行します。
関連項目
デフォルトでは、接続しているスキーマの表およびビューがリストされます。
他のスキーマを追加するには、次の手順を実行します。
スキーマを初めて追加する場合は、「スキーマの追加」をクリックします。
スキーマをすでに追加している場合は、「スキーマの編集」をクリックします。
「スキーマ・リストの編集」ダイアログ・ボックスが開きます。「使用可能なスキーマ」は、ユーザーがアクセス権を持つスキーマのリストです。これらのスキーマのいずれかの表およびビューを表示するには、その名前を「選択したスキーマ」に移動します。
たとえば、SHスキーマの表を表示するには、SHを「選択したスキーマ」リストに移動します。「OK」をクリックします。
「データ・ソースの定義」ウィザードに戻ります。「他のスキーマからの表を含める」を選択します。追加されたスキーマの表およびビューがリストされます。たとえば、「SH」を選択すると、「使用可能な表/ビュー」リストにSH.CUSTOMERS
などの表が表示されるようになります。これらの表をデータ・ソースとして選択できます。
使用できない表またはビューを使用するワークフローをインポートした場合は、データ・ソース・ノードの定義ウィザードを使用して、欠落しているデータ・ソースを置換するためのデータ・ソースを定義できます。
ウィザードでは、JSONデータ型を持つ入力列を検出することもできます。このインタフェースを使用して、次のことを実行できます。
新しいデータ・ソース・ノードの表および属性を定義します。
既存のデータ・ソース・ノードを編集します。
このウィザードには次の2つのステップがあります。
「データ・ガイドの編集」ダイアログ・ボックスでは、ユーザーは選択したJSON型列にデータ・ガイドの生成方法を指定できます。
「データ・ガイドの編集」ダイアログ・ボックスには、次の2つのタブがあります。
構造: 選択した列のJSONデータ構造を表示します
データ: インポートまたは生成されたデータ・ガイド表の内容を表示します
次のタスクを実行できます。
データ・ガイドの生成: ノードの実行中または再実行中はいつでも新しいデータ・ガイド表を生成できます。データ・ガイドを生成するには、「データ・ガイド生成」ドロップダウン・リストから次のオプションのいずれかを選択します。
デフォルト: 「JSON設定」ダイアログ・ボックスでオプション「必要に応じてデータ・ガイドを生成」
が選択されている場合、データ・ガイド表はノードが実行中または再実行中であれば生成されます。そうでない場合、データ・ガイドは生成されません。
オン: ノードの実行中または再実行中いつでも新しいデータ・ガイド表が生成されるようにするには、このオプションを選択します。
オフ: ノードの実行中または再実行中に新しいデータ・ガイド表が生成されないようにするには、このオプションを選択します。
ワークフローからインポート: 「データ・ガイドの選択」ダイアログ・ボックスを使用して、同じワークフロー内または別のワークフローのデータ・ソース・ノードまたは表作成ノードで定義されている既存のJSON型の列からデータ・ガイドをインポートするには、このオプションを選択します。
ファイルからインポート: CSVファイルからデータ・ガイドをインポートするには、このオプションを選択します。このプロセスでは、データ・ガイドを検証、すなわち、インポート操作中の列ヘッダー、JSONパス形式、JSON型などの正確性を確認します。
データ・ガイドの削除: 現在のデータ・ガイド表を削除するには、をクリックします。
データ・ガイドのエクスポート: 現在のデータ・ガイド表をCSVファイルにエクスポートするには、このオプションを選択します。生成されたデータ・ガイドが、基礎となるJSONデータを完全には表していないことが判明した場合は、データ・ガイドをエクスポートして、欠落しているJSONパスを追加するオプションがあります。その後、データ・ソースをインポートして戻して、生成済のデータ・ソースを置換できます。
関連項目
「JSON解析設定」ダイアログ・ボックスで、データ・ガイドの生成方法を決定するノード設定を指定できます。
データ・ガイドは、JSON構造(JSON問合せノードなど)がUIに存在する場合は常に使用されます。データ・ガイド表の生成(特に大きなJSONデータの場合)は時間がかかるため、次の設定によって表の生成がある程度制御されます。
必要に応じてデータ・ガイドを生成: デフォルトで、このオプションが選択されています。JSON型の列の場合にデータ・ガイドが生成されます。JSONデータが製品で使用されていない場合は、このオプションの選択を解除します。したがって、データ・ガイドは生成されません。
サンプリング: 列に格納されている処理対象のJSONドキュメントの数を定義して、データ・ガイド表を生成します。JSONドキュメントには、特定の行のJSON列の内容全体が含まれます。
ドキュメントの最大数: 2000
(デフォルト)。この設定を変更するには、矢印を使用します。
処理するドキュメント値の制限: データ・ガイド表を生成するために解析するドキュメント内のJSON値(数字、文字列、ブール)の数を定義します。
ドキュメント当たりの最大数: 10,000
(デフォルト)。この設定を変更するには、矢印を使用します。
「データ・ソース・ノードの編集」ダイアログ・ボックスで、データ・ソース・ノードの操作を変更できます。
既存のデータ・ソース・ノードを編集するには、次の手順を実行します。
関連項目
有効なデータ・ソース・ノードを実行するには、ノードを右クリックして、「実行」を選択します。
Oracle Data Minerサーバーは、選択した表またはビューのサンプルを生成します。使用される表のサイズおよびサンプリングのタイプは、ノードの「サンプル」設定によって決まります。
ノードが完了したが、実行中の子ノードにデータを提供する必要がある場合は、そのノードが検証のために実行され、列および表がまだ存在していることが確認されます。エラーがある場合、そのノードの状態は「エラー」
に設定され、影響を受ける属性は「無効」
に設定されます。
コンテキスト・メニューのオプションは、ノードのタイプによって異なります。様々なタスクを実行したり、ノードに関する情報を表示するためのショートカットが用意されています。
データ・ソース・ノードを右クリックします。コンテキスト・メニューでは、次のオプションを使用できます。
編集: 「データ・ソース・ノードの編集」ダイアログ・ボックスを開きます。
属性: 「属性の選択」ダイアログ・ボックスを開きます。
実行
データの表示: データ・ソース・ノード・ビューアのダイアログ・ボックスを開きます。
パフォーマンス設定。これにより、ノードのパラレル設定およびインメモリー設定を指定できる「選択したノードの設定の編集」ダイアログ・ボックスが開きます。
ランタイム・エラーの表示。エラーがある場合にのみ表示されます。
検証エラーの表示。検証エラーがある場合にのみ表示されます。
データ・ビューアには、ノードに含まれるデータ、グラフ、列およびSQL問合せに関する情報が含まれます。
データを表示するには、ノードを右クリックして、コンテキスト・メニューから「データの表示」を選択します。データ・ビューアが開きます。
注意:
データ・ソース・ノードが有効
状態の場合にのみ、データを表示できます。
データ・ビューアには次のタブがあります。
「データ」タブには、データのサンプルが表示されます。
データ・ビューアは、サンプリングからのデータまたはソース表に遡るノード系統から取得されたデータの行のグリッド表示を提供します。
次のタスクを実行できます。
リフレッシュ: をクリックして、データをリフレッシュします。
表示: 「表示」をクリックし、「実際のデータ」またはキャッシュされたデータを選択します。キャッシュされたデータは、「プロパティ」ペインの「キャッシュ」セクションでデータをキャッシュしている場合にのみ使用できます。
ソート: 「ソート」をクリックして、適用可能な基準に従ってデータをソートします。「ソートする列の選択」ダイアログ・ボックスが表示されます。
フィルタ: 「フィルタ」フィールドで、WHERE
句を入力してデータを選択します。
「列」タブは、ノードからの出力であるすべての列のリストです。
各列について、「名前」、「データ型」、「マイニング型」、「長さ」、精度とスケール(浮動小数点の場合)および「列ID」が表示されます。
ノードが未実行である場合、データベースにより提供される表またはビュー構造が表示されます。
ノードが正常に実行されると、ノードの指定時に定義されたサンプリングに基づいて、サンプル表の構造が表示されます。
表示される列を制限する複数のフィルタリング・オプションがあります。(または)/(および)
の接尾辞を指定したフィルタ設定を使用すると、スペースで区切られた複数の文字列を入力できます。たとえば、「名前/データ型/マイニング型(いずれか)」
が選択されている場合、フィルタ文字列A B
では、「名前」、「データ型」または「マイニング型」が文字AまたはBで始まるすべての列が生成されます。
「SQL」タブには、「SQLの詳細」テキスト領域があります。このテキスト領域には、「データ」タブに表示される実際のビューで提供されるデータを生成するSQLコードが表示されます。
SQLは、実際のデータにアクセスするために必要な系統に応じて親ノードからのSQLが含まれる、積み重ね型の式にすることができます。
SQLをコピーして、そのSQLを適切なSQLインタフェースで実行できます。「すべて選択」([Ctrl]+[A])および「コピー」([Ctrl]+[C])が有効化されています。
検索コントロールは、一致したテキストをハイライトし、前方検索および後方検索を実行する標準の検索コントロールです。
「プロパティ」ペインで、ノードの特性やプロパティを調査および変更できます。
ノードのプロパティを表示するには、ノードをクリックし、「プロパティ」をクリックします。「プロパティ」ペインが閉じている場合は、「表示」に移動して「プロパティ」をクリックします。または、ノードを右クリックし、「プロパティに移動」をクリックします。データ・ソース・ノードの「プロパティ」ペインには、次のセクションがあります。
関連項目
「プロパティ」の「データ」セクションには、データおよびデータ・ソースに関する情報が表示され、これは表である場合とビューである場合があります。
「データ」セクションは、次のように構成されています。
ソース表: データ・ソース・ノードのソース表またはビューの名前が表示されます。ノードに関連付けられているソース表がない場合は、「ソース表」の右にある「…」をクリックします。データ・マイニング・アカウントからアクセスできる表およびビューのリストが表示されます。表またはビューを選択できます。表またはビューを変更する場合もこのプロセスを使用できます。
データ: 属性をグリッドに表示します。各属性について、名前、別名およびデータ型が表示されます。次のタスクを実行できます。
属性の別名の作成(適切なセルに別名を入力)。
属性のフィルタ。
属性の削除。属性を選択し、をクリックします。
属性の編集。属性を選択し、をクリックします。
データ・ソースに含める属性の選択。
ノードのリフレッシュ。をクリックします。
「キャッシュ」セクションには、出力データのキャッシュを生成するオプションがあります。変換プリファレンスを使用して、このデフォルトを変更できます。
次のタスクを実行できます。
出力データのキャッシュ生成による結果表示の最適化: キャッシュを生成する場合は、このオプションを選択します。デフォルト設定では、キャッシュを生成しません。
サンプリング・サイズ: キャッシュを選択したり、デフォルト設定をオーバーライドできます。 デフォルトのサンプリング・サイズは「行数」
です デフォルト値は2000
です
関連項目
データの参照ノードでは、入力データ・ソースのプロファイルを提供します。データの統計を参照は、すべてのデータ、またはデータのサンプルのいずれかに基づきます。
データの参照ノードでは、次のことを実行できます。
各列に共通の統計およびヒストグラムを表示します。オプションで、「GROUP BY」属性を選択し、生成されたヒストグラムの多変量ビューを表示できます。
すべての統計分析の結果が含まれる出力フローを生成します。データ入力の任意のソースをデータの参照ノードに接続できます。たとえば、データの参照ノードを適用ノードにアタッチできます。
サポートされているすべてのデータ型、および日時データ型については次のデータ型を使用して属性を分析します。
DATE
TIMESTAMP
TIMESTAMP_WITH_TIMEZONE
TIMESTAMP_WITH_LOCAL_TIMEZONE
データの参照ノードをパラレルに実行します。
グラフを作成します。
SQL Developerを使用して、データの参照ノードによって生成された統計をエクスポートします。
関連項目
データの参照ノードを作成し、それをデータ・ソースに接続して、データ・ソースのデータを分析します。データの参照ノードは任意のデータ・ソースに接続できます。
データの参照ノードを作成するには、次の手順を実行します。
デフォルトでは、データ・ソースのすべての属性が表示されます。分析する特定の属性を指定できます。
「データの参照ノードの編集」ダイアログ・ボックスで、入力および統計に関する情報を表示および編集できます。
データの参照ノードを編集するには、ノードをダブルクリックするか、ノードを右クリックして、「編集」を選択します。
「データの参照ノードの編集」エディタには、次のタブがあります。
「入力」タブで、分析する属性を指定できます。デフォルトでは、データ・ソースのすべての属性が表示されます。
デフォルトでは、「GROUP BY」属性は選択されていません。「GROUP BY」には、「データの参照」でビニングできるデータ型に限定された属性のソート済リストが表示されます。「GROUP BY」属性を選択すると、選択した属性に基づいてデータを分析できます。たとえば、データにAGEおよびGENDERが属性として含まれているとします。「GROUP BY」属性として「AGE」を選択した場合、GENDERのヒストグラムには、各GENDER値の年齢構成が表示されます。
次のいずれかの方法で、分析する属性のリストを変更します。
データの参照ノードを右クリックして、「編集」を選択します。「属性の選択」ダイアログ・ボックスが開きます。
データの参照ノードを選択します。データの参照ノードの「プロパティ」ペインの「検索」タブでは、属性のリストを変更できます。
関連項目
「統計」タブには、使用可能な統計のリストが含まれます。各統計について、簡単な定義、およびその統計を計算する場合のコストが示されます。
「統計」タブをクリックして、計算する統計を指定します。参照ノードの「プロパティ」ペインの「統計」セクションを使用して、統計を変更することもできます。
デフォルトの選択を1つでも変更した場合は、「デフォルトに戻す」をクリックして、すべての選択をデフォルトの選択に変更します。
個別の統計を名前で検索できます。
デフォルトでは、Oracle Data Minerによって次の統計が計算されます。
平均
個別パーセント
最大値
中央値
最小値
モード(サンプル)
パーセントNULL
標準偏差
分散
デフォルトの統計には、低または中の計算コストがあります。
歪度と尖度の計算は高コストです。これらは、デフォルトでは選択されていません。必要な場合は、これらを選択できます。
サンプルを使用したモードの計算は、低コストの操作です。使用可能なすべてのデータを使用したモードの計算は、非常に高コストの操作です。サンプル・データまたは使用可能なすべてのデータを使用してモードを計算するには、「データの参照ノードの編集」ダイアログ・ボックスで「モード(サンプル)」をクリックします。
関連項目
データの参照ノード・ビューアには、データの参照ノードによって実行された統計およびその他の分析が表示されます。
ノードが正常に実行されると、データの参照ノード・ビューアでデータを表示できるようになります。
データを表示するには、ノードを右クリックして、「データの表示」を選択します。ビューアが新しいタブに開きます。
ビューアでは、次のタブに情報が表示されます。
「統計」タブには、データの参照ノードで計算された統計が表示されます。
属性が「統計」グリッドにリストされます。各属性について、統計の名前、データ型、ヒストグラムおよびサマリーが表示されます。
属性の大きいバージョンのヒストグラムを表示するには、属性を選択します。ヒストグラムがグリッドの下に表示されます。属性にNull値が含まれる場合、ヒストグラムには「Nullのビン」
のラベルが付いた個別のビンがあります。ヒストグラムには、NULL
ではないが、他のビンに含まれない値で構成される「その他」
ビンも含まれる場合があります。
ヒストグラムの詳細は、大きいヒストグラムに移動し、属性名を右クリックします。次の選択が可能です。
クリップボードにコピー: ヒストグラムをMicrosoft Windowsクリップボードにコピーします。このヒストグラムを、ワード・プロセッサや画像エディタなどのリッチ・エディタに貼り付けることができます。
画像を別名で保存: 画像を、ファイル・システムに保存できるPNGファイルにエクスポートします。
データの表示: ヒストグラムの作成に使用されたデータがポップアップ・ウィンドウに表示されます。属性名、属性値または属性パーセントを検索できます。終了したら、「閉じる」をクリックします。
Oracle Data Minerで作成されたヒストグラムは、データのサンプルを使用し、表示されるたびに少し異なる可能性があります。
すべてのデータ型について、ヒストグラムが作成されます。個別値の数字、NULL
値のパーセンテージ、および個別値の数が表示されます。
属性のデータ型に従って計算された追加の統計:
文字属性VARCHAR2
の場合、モードが計算されます。
数値属性「NUMBER」
または「FLOAT」
の場合は、次の計算が実行されます。
平均
最小値
最大値
標準偏差
歪度(分布の非対称の測定)
尖度(そのモードに関するリージョン内での頻度分布を示す曲線のフラット度またはピーク度の測定)
「列」タブは、ノードからの出力であるすべての列のリストです。
各列について、「名前」、「データ型」、「マイニング型」、「長さ」、精度とスケール(浮動小数点の場合)および「列ID」が表示されます。
ノードが未実行である場合、データベースにより提供される表またはビュー構造が表示されます。
ノードが正常に実行されると、ノードの指定時に定義されたサンプリングに基づいて、サンプル表の構造が表示されます。
表示される列を制限する複数のフィルタリング・オプションがあります。(または)/(および)
の接尾辞を指定したフィルタ設定を使用すると、スペースで区切られた複数の文字列を入力できます。たとえば、「名前/データ型/マイニング型(いずれか)」
が選択されている場合、フィルタ文字列A B
では、「名前」、「データ型」または「マイニング型」が文字AまたはBで始まるすべての列が生成されます。
「プロパティ」の「データ」セクションには、データおよびデータ・ソースに関する情報が表示され、これは表である場合とビューである場合があります。
「データ」セクションは、次のように構成されています。
ソース表: データ・ソース・ノードのソース表またはビューの名前が表示されます。ノードに関連付けられているソース表がない場合は、「ソース表」の右にある「…」をクリックします。データ・マイニング・アカウントからアクセスできる表およびビューのリストが表示されます。表またはビューを選択できます。表またはビューを変更する場合もこのプロセスを使用できます。
データ: 属性をグリッドに表示します。各属性について、名前、別名およびデータ型が表示されます。次のタスクを実行できます。
属性の別名の作成(適切なセルに別名を入力)。
属性のフィルタ。
属性の削除。属性を選択し、をクリックします。
属性の編集。属性を選択し、をクリックします。
データ・ソースに含める属性の選択。
ノードのリフレッシュ。をクリックします。
「SQL」タブには、「SQLの詳細」テキスト領域があります。このテキスト領域には、「データ」タブに表示される実際のビューで提供されるデータを生成するSQLコードが表示されます。
SQLは、実際のデータにアクセスするために必要な系統に応じて親ノードからのSQLが含まれる、積み重ね型の式にすることができます。
SQLをコピーして、そのSQLを適切なSQLインタフェースで実行できます。「すべて選択」([Ctrl]+[A])および「コピー」([Ctrl]+[C])が有効化されています。
検索コントロールは、一致したテキストをハイライトし、前方検索および後方検索を実行する標準の検索コントロールです。
参照ノードが実行されている場合、そのノードは、自身が計算した統計をデータベース表に書き込みます。参照ノードによって計算された統計をMicrosoft Excelスプレッドシートにエクスポートできます。
統計をエクスポートするには、次の手順を実行します。
スプレッドシートには、統計が含まれます。データの参照ノードによって生成されたヒストグラムの名前が含まれます。
個々のヒストグラムをエクスポートするには、そのヒストグラムを右クリックして、グラフィックを保存します。
コンテキスト・メニューのオプションは、ノードのタイプによって異なります。様々なタスクを実行したり、ノードに関する情報を表示するためのショートカットが用意されています。
データの参照ノードのコンテキスト・メニューでは、次のことを選択できます。
関連項目
「プロパティ」ペインで、ノードの特性やプロパティを調査および変更できます。
ノードのプロパティを表示するには、ノードをクリックし、「プロパティ」をクリックします。「プロパティ」ペインが閉じている場合は、「表示」に移動して「プロパティ」をクリックします。または、ノードを右クリックし、「プロパティに移動」をクリックします。
データの参照ノードの「プロパティ」ペインには、次のセクションがあります。
「入力」セクションでは、分析される属性がリストされます。
属性がグリッドにリストされます。各属性について、名前およびデータ型が表示されます。属性のリストを名前またはデータ型でソートするには、グリッド内のヘッダーをクリックします。
「GROUP BY」属性を指定できます。リストから属性を選択します。
デフォルト設定を選択したり、次のように列を選択できます。
列を選択するには、「自動入力列の選択」の選択を解除します。
属性を削除するには、属性を選択し、をクリックします。
属性を編集するには、をクリックします。
「属性の選択」ダイアログ・ボックスが開きます。
関連項目
「出力」セクションには、データ・ソースの列がリストされます。
各列の名前およびデータ型がグリッドにリストされます。グリッドを名前(デフォルト)またはデータ型で検索できます。
検索をクリアするには、をクリックします。
ビンを使用してヒストグラムを作成します。「ヒストグラム」タブには、デフォルトのビン数がリストされます。
次のタイプのビンのデフォルトのビン数:
数値型ビン
カテゴリ型ビン
日付型ビン
NULL値
その他の値
これらすべてのビン・タイプのデフォルトのビン数は10
です。デフォルトは、最大ビン数を指定します。
グラフ・ノードは、数値データの2次元グラフを作成します。
グラフ・ノードは、データ・プロバイダではありません(つまり、別のノードには接続できません)。
注意:
グラフ・ノードではコードを生成できません。
次のタスクを実行できます。
折れ線グラフ、散布図、棒グラフ、ヒストグラム、ボックスなど、様々なタイプのグラフを1つ以上作成して編集します。
実際のデータおよびサンプル・データを使用してグラフを作成します。
グラフ・ノードをパラレルに実行します。
NUMBER、FLOAT、DATEおよびTIMESTAMP
データ型がサポートされます。関連項目
グラフ・ノードでは、数値データの2次元グラフを複数の方法で作成できます。
次のタイプのグラフを作成できます。
線プロット: 線を使用して、データ・ポイントを接続します。線プロットは、2つの変数が相関関係にあるかどうかを識別する場合に役立ちます。Oracle Data Minerでは、2次元の線プロットをサポートしています。
棒プロット: 値を比較します。棒の高さは、測定された値または頻度を表します。
ヒストグラム: 間隔における観測の頻度に等しい領域を持つ、各間隔上に垂直に描画された隣接する長方形(ビン)として、頻度を表示します。
散布図: 2つの個別値セットで値を表示します。1つの変数が水平軸上の位置を決定し、もう一方の変数が垂直軸上の位置を決定します。
ボックス・プロットまたはボックス・グラフ: データの分位を使用して、数値データのグループをグラフィカルに示します。
グラフ・ノードでは、1つ以上の軸を指定する必要があります。軸は、数値データで構成される必要があります。
グラフ・ノードでは、NUMBER、FLOAT、DATEおよびTIMESTAMP
データ型がサポートされます。
サポートされているデータ型は次のとおりです。
NUMBER
FLOAT
DATE
TIMESTAMP
TIMESTAMP_WITH_TIMEZONE
TIMESTAMP_WITH_LOCAL_TIMEZONE
コンテキスト・メニューのオプションは、ノードのタイプによって異なります。様々なタスクを実行したり、ノードに関する情報を表示するためのショートカットが用意されています。
関連項目
グラフ・ノードを実行して、サンプル・データを生成します。
グラフ・ノードを実行するには、グラフ・ノードを右クリックし、「実行」をクリックします。サンプル・データを生成しない場合は、ノードに提供されているデータを使用してグラフが作成されます。
注意:
グラフ・ノードが含まれるワークフローをインポートする場合は、グラフ・ノードを実行して、グラフを表示する必要があります。
「新規グラフ」ダイアログ・ボックスでは、デフォルト名を使用してグラフを定義します。
ここで、グラフの名前を変更できます。
作成するグラフのタイプを選択し、その定義手順に従います。
定義したグラフがコンテナに表示されます。グラフを作成したら、定義を編集できます。グラフの追加、グラフの削除、グラフの構成に使用されたデータの表示、グラフィックとしてのグラフの保存を実行することもできます。
折れ線グラフには、共通の目盛に対してプロットされた、一定期間における連続データが表示されます。散布図は一般に、科学、統計およびエンジニアリング・データなどの数値を表示および比較するために使用されます。
「折れ線」または「散布図」を作成するには、次の手順を実行します。
ボックス・プロットは、選択した属性(X軸)のビニングされたデータをまとめます。データの分位を使用して、数値データのグループをグラフィカルに示します。
ボックスの下部および上部は、1番目および3番目の分位であり、ボックス内の帯は2番目の分位(中央値)です。Data Minerで作成されたタイプのボックス・プロットは、ウィスカーがすべてのデータの最小値および最大値を示します。
ボックス・プロットまたはボックス・グラフを指定するには、次の手順を実行します。
関連項目
グラフ内の選択された属性のデータ型に固有の設定を指定できます。
選択した属性のデータ型に応じて、「設定」をクリックしたときに、次のダイアログ・ボックスのいずれかが表示されます。
「表示する値を選択」ダイアログ・ボックスでは、グラフを定義するときに特定の属性値を指定できます。
軸または「GROUP BY」属性のカテゴリ属性を指定する場合は、「設定」をクリックして、「表示する値を選択」ダイアログ・ボックスを表示します。
属性の値が「値」列にリストされます。次の値のいずれかを選択します。
すべて
なし
デフォルト
デフォルトでは、「トップN」を使用して、頻度が高い値が選択されます。
値のチェック・ボックスをクリックして、特定の値を選択します。
検索ボックスを使用して、値を検索できます。
終了したら、「OK」をクリックして、グラフの定義に戻ります。
グラフ・ノード・エディタには、定義されているすべてのグラフが表示されます。既存のグラフを変更したり、ノードにグラフを追加できます。
少なくとも1つのグラフがグラフ・ノードに定義されている場合は、グラフ・ノードをダブルクリックして、グラフ・ノード・エディタを開きます。グラフが定義されていない場合は、「新規グラフ」ダイアログ・ボックスが開きます。
各グラフはコンテナ内にあります。グラフ・コンテナは、グリッドにレイアウトされます。
グラフの詳細を表示するためにズームインすることもできます。
次のアイコンは、ノードのすべてのグラフに適用できます。
新規グラフを追加するには、 をクリックして「新規グラフ」ダイアログ・ボックスを開きます。
表示をリフレッシュするには、をクリックします。
グラフの作成に使用するデータを選択するには、「表示」.をクリックしますオプションは次のとおりです。
実際のデータ: デフォルトを表示しますが、グラフ・ノードを実行した場合は除きます。その場合は、ノードが提供されているすべてのデータを使用してグラフを作成します。
サンプル・データ: サンプル・データを生成するためにグラフ・ノードを実行した場合にのみ使用可能です。
新規グラフまたは既存グラフの名前が、次のコントロールとともにグラフのコンテナの上部に表示されます。
グラフのサイズを調整する(ズームインおよびズームアウト)には、をクリックします。
現在のグラフを編集するには、をクリックします。グラフを編集または追加すると、結果が自動的にエディタに表示されます。
現在のグラフを削除するには、をクリックします。
グラフの特定の値を調べるには、グラフを拡大します。
関連項目
グラフ・ノード・エディタには、選択した値にズームインして詳細を表示するオプションがあります。
グラフの詳細を調べるには、選択した値にズームインします。たとえば、選択したX軸値の詳細を確認するには、マウスを使用してそれらの値を囲む選択ボックスを描画します。ディスプレイには、選択ボックス内の値の詳細が表示され、軸が展開されます。複数回ズームできます。選択した値の表示が終了したら、ズームインした回数だけグラフをクリックして、元のグラフに戻ります。
グラフを編集して、現在の属性を変更したり、別のグラフ・タイプを指定できます。
グラフを編集する場合、次のことを実行できます。
既存のグラフ・タイプの属性を変更します。たとえば、折れ線グラフを編集する場合は、X軸とY軸を変更したり、「GROUP BY」属性を追加できます。軸処理や表示する値を変更できます(グラフでこれらの項目が使用されている場合)。
別のグラフ・タイプを指定します。グラフのタイプを変更できます。たとえば、折れ線グラフをヒストグラムに変更できます。グラフのタイプを変更するには、ウィンドウの上部にあるボタンをクリックし、次のように必要な情報を指定します。
ボックス・プロットは、選択した属性(X軸)のビニングされたデータをまとめます。データの分位を使用して、数値データのグループをグラフィカルに示します。
ボックスの下部および上部は、1番目および3番目の分位であり、ボックス内の帯は2番目の分位(中央値)です。Data Minerで作成されたタイプのボックス・プロットは、ウィスカーがすべてのデータの最小値および最大値を示します。
ボックス・プロットまたはボックス・グラフを指定するには、次の手順を実行します。
関連項目
グラフ・ノードのプロパティは、表示されているノード名によって識別されます。「プロパティ」ペインで、ノードの特性やプロパティを調査および変更できます。
ノードのプロパティを表示するには、ノードをクリックし、「プロパティ」をクリックします。「プロパティ」ペインが閉じている場合は、「表示」に移動して「プロパティ」をクリックします。または、ノードを右クリックし、「プロパティに移動」をクリックします。
グラフ・ノードの「プロパティ」ペインは、次のセクションで構成されています。
関連項目
出力データのキャッシュを生成するオプションがあります。
サンプル・データを生成すると、オプション「出力データのキャッシュ生成による結果表示の最適化」が選択されます。
デフォルト値は2000
レコードです。この値は変更できます。
「詳細」セクションには、ノード名およびノードについてのコメントが表示されます。
このセクションでは、ノード名の変更およびコメントの編集が可能です。新しいノード名およびコメントは、要件を満たしている必要があります。
関連項目
「プロパティ」の「データ」セクションには、データおよびデータ・ソースに関する情報が表示され、これは表である場合とビューである場合があります。
「データ」セクションは、次のように構成されています。
ソース表: データ・ソース・ノードのソース表またはビューの名前が表示されます。ノードに関連付けられているソース表がない場合は、「ソース表」の右にある「…」をクリックします。データ・マイニング・アカウントからアクセスできる表およびビューのリストが表示されます。表またはビューを選択できます。表またはビューを変更する場合もこのプロセスを使用できます。
データ: 属性をグリッドに表示します。各属性について、名前、別名およびデータ型が表示されます。次のタスクを実行できます。
属性の別名の作成(適切なセルに別名を入力)。
属性のフィルタ。
属性の削除。属性を選択し、をクリックします。
属性の編集。属性を選択し、をクリックします。
データ・ソースに含める属性の選択。
ノードのリフレッシュ。をクリックします。
SQL問合せノードは、特別なデータ準備を実行するSQL問合せを記述します。SQL問合せノードを使用して、モデル構築の入力を提供します。
次の操作を実行できます。
できるかぎり最小限の制約でSQL問合せを手動で入力します。
Oracle Data Minerワークフローの一部として、様々な方法を組み込みます。既存のデータを使用して、SQL問合せをデータのソースとして、または変換として挿入できます。
データベースに登録されているOracle R Enterpriseスクリプトを実行します。
パラレル・プロセスまたはパラレル問合せを実行します。
SQL問合せノードの入力には、データ・プロバイダ・ノードおよびモデル・プロバイダ・ノードを使用できます。
SQL問合せノードでは、次の入力が必要です。
データ・ソース・ノードや変換ノードなど、ゼロから複数のデータ・プロバイダ・ノード。
モデル構築ノードやモデル・ノードなど、ゼロから複数の入力モデル・プロバイダ・ノード。
データ・プロバイダ・ノードは次のように使用されます。
データ・プロバイダ・ノードが0個の場合は、Oracle Data Miner内で定義する必要がある入力ソースによる制約がないSQL SELECT
文を使用して、元となるデータ・ソース・ノードを定義します。この文には、次のような独自の内部表参照を含めることができます。
Select * from a, b where a.id = b.id
データ・プロバイダ・ノードが0個の場合、ソース表またはビューはData Minerで非表示になります。コード生成では、生成されたSQL文でそのような表をパラメータ化できません。
データ・プロバイダ・ノードが1個以上ある場合、式ビルダー・インタフェース内で各データ・フローを参照できます。Oracle Data Minerワークフロー内のすべてのデータ・ソースを引き続き公開できます。
モデル・プロバイダ・ノードが入力として接続されていると、ユーザーはノードに含まれるモデル名のリストを表示できます。これは、モデル名が必要なSQLを作成する場合に役立ちます。
Oracle Data Minerには、SQL問合せの記述に役立つスニペットが含まれます。
SQL問合せノード・エディタを使用すると、SQL問合せを定義および検証できます。
エディタに用意されている指定を、問合せ構築テキスト領域にドラッグ・アンド・ドロップしたりダブルクリックできます。ウィンドウの左側のタブには、問合せの記述に関するヘルプが表示されます。
「ソース」は、データ・プロバイダ・ノードとモデル・プロバイダ・ノードの両方を含む入力ノードのリストです。「ソース」リストで項目を選択すると、「メッセージ」ボックスに情報が表示されます。
「スニペット」は、計算のタイプ別に並べられた標準のSQL Developerスニペット(部分的なSQLコード)です。
スニペットのカテゴリである「予測問合せ」は、DBMS_PREDICTIVE_ANALYTICS PL/SQL
パッケージを使用して問合せを記述する場合に役立ちます。
スニペットの詳細は、『Oracle SQL Developerユーザーズ・ガイド』を参照してください。
スニペットの機能の簡単な説明については、その名前の上にカーソルを置きます。情報がツールヒントに表示されます。
「PL/SQLファンクション」は、ユーザー・スキーマでのPL/SQLファンクションのリストです。
「Rスクリプト」は、登録されているRスクリプトのリストで、このタブは、Oracle R Enterpriseがインストールされている場合に表示されます。
テキスト領域にSQLを記述します。
テキスト領域の下には次のものがあります。
列 - 列およびデータ型をリストします。
プレビュー - 問合せによって返される少数の行を表示します。
「OK」または「検証」をクリックすると、次のことが確認されます。
問合せでは、少なくとも1つの出力列が生成されます。
すべてのデータ型はOracle Data Minerでサポートされるデータ型です。ほとんどのスカラー・データ型がサポートされています。サポートされていない最も一般的なデータ型は、ユーザー・カスタム・オブジェクト・タイプです。
サポートされていないデータ型が見つかった場合は、表が作成され、エラー・メッセージが列パネルの上に表示されます。列リスト内の許容できないすべてのデータ型は、列名の横にある無効アイコンでマーク付けされます。
問合せの解析中に検証エラーが発生しなかった場合、「列」タブには列のデータ型が表示され、「データ」タブには結果の簡単なサンプルが表示されます。
検証エラーが発生した場合は、検証パネルが「列」および「データ」タブに表示されます。
関連項目
Oracle Advanced Analyticsオプションの構成要素であるOracle R Enterpriseは、オープン・ソースの統計プログラミング言語であるRとその環境をエンタープライズ対応およびビッグ・データ対応にします。
Oracle R Enterpriseは、RとOracle Databaseを統合します。大量のデータが関与する問題用に設計されています。
Rのユーザーは、データベースの並列性とスケーラビリティを利用するRスクリプトを開発、改良およびデプロイして、予測分析およびデータ分析を実行できます。
Oracle Data Miner のSQL問合せノードは、登録されているRスクリプトをデータベースに統合するための簡易インタフェースを提供します。これにより、Rの開発者はデータ分析用の有用なスクリプトを提供できます。
次のインタフェースを使用する埋込みRスクリプトを実行できます。
rqEval
rqTableEval
rqRowEval
rqGroupEval
OMDRUSER
ロールに追加されました。 Oracle R Enterpriseデータベース・ロールがOMDRUSER
ロールに追加されました。
OMDRUSER
ロールには、次の2つのロールが両方含まれています。
RQUSER
RQADMIN
RQUSER
ロールとRQAMIN
ロールが、Oracle Data Minerリポジトリのインストール時にデータベース構成で使用できない場合、これらのロールは、Oracle R Enterpriseのインストール後、DBAが手動でODMRUSER
ロールに追加する必要があります。
Rスクリプトを使用するには、Rスクリプトを登録する必要があります。スクリプトは、DBA権限を使用した接続を介して、SQL*PlusまたはSQLワークシートを使用して登録できます。
登録されたRスクリプトは、SQL問合せノードの「Rスクリプト」タブ上にリストされます。Rコード・スニペット(スクリプトの記述に役立つ部分的なコード)もあります。スニペットは、構文のみの場合や、例が含まれる場合もあります。SQLワークシートの使用時や、SQL問合せノードを使用したRコードの作成または編集時に、スニペットを挿入および編集できます。
コンテキスト・メニューのオプションは、ノードのタイプによって異なります。様々なタスクを実行したり、ノードに関する情報を表示するためのショートカットが用意されています。
コンテキスト・メニューを表示するには、データ・ソース・ノードを右クリックします。コンテキスト・メニューでは、次のオプションを使用できます。
表更新ノードは、ノードへのデータ入力で選択された列を使用して既存の表を更新します。入力列は、既存の表の列にマッピングされます。
表更新ノードはパラレルに実行できます。表更新ノードは、データベース・リソースを使用して、自身を定義します。データベース・リソースが変更された場合は、ノード定義のリフレッシュが必要になることがあります。たとえば、リソースが削除または再作成された場合です。
関連項目
表更新ノードの入力は、データ・フローを生成する任意のノードです。表更新ノードには1つのノードのみを接続できます。
表更新ノードの出力は、データ・フローです。データ・フローをデータ・ソースとして使用できます。出力を表またはビューとして保存するには、表またはビュー作成ノードを使用します。
関連項目
表更新ノードは、特定のデータ型をサポートしています。Bなどのその他の型をサポートしたり、手動マッピングでこれらの追加型をサポートすることもできます。
厳密に一致するデータ型は列に存在しないが、その列のデータ型にある程度安全なデフォルトの暗黙的変換がある場合は、それらの列を手動でマッピングできます。たとえば、BINARY_DOUBLE
をNUMBER
に、またはNVARCHAR2
をVARCHAR2
にマッピングできます。このようなマッピングでは、次のように一部のデータが損失する可能性があります。
BINARY_DOUBLE
またはBINARY_FLOAT
をNUMBER
にマッピングすると、精度が損われる場合があります
NVARCHAR2
およびNCHAR
をVARCHAR2
にマッピングすると、NVARCHAR2
とNCHAR
はVARCHAR2
とは潜在的に異なる文字セットに基づいているため、データが損われる可能性があります。マッピングが機能するには、NVARCHAR2
とNCHAR
がVARCHAR2
と同じ文字セットに基づくようにデータベースが設定されている必要があります。
表更新ノードを作成して、既存の表内の選択した列のデータを使用して、その表を更新します。表更新ノードは、データ・フローを作成する任意のノード(適用ノードなど)に接続できます。
表更新ノードを作成するには、次の手順を実行します。
関連項目
表更新ノードの自動動作は、「自動入力列の選択」オプションの選択によって異なります。
「自動入力列の選択」オプションが選択されている場合、シナリオごとの動作は次のとおりです。
入力が接続されている場合 - 更新する選択済の表が表更新ノードにある場合、その表内の、既存の列と一致する列はその列に自動的にマッピングされます。少なくとも1つの列が仕様に含まれていた場合、ノードは有効になります。
入力が切断されている場合 - すべての列が自動的に削除されます。ノードは無効になります。
入力ノードが編集されている場合:
列が入力ノードに追加された場合、その列は、既存の表に一致する列が存在すれば、更新ノードに追加されます。
列が削除された場合、その列はノードから削除されます。
列が編集された場合、次の2つの可能性があります。
編集された列が既存の列と一致しなくなった場合、その列は削除されます。
編集された列が既存の列と一致する場合、その列は追加されます。
「自動入力列の選択」が選択されていない場合、表更新ノードに対して手動で列指定を追加および削除する必要があります。
「表更新ノードの編集」ダイアログ・ボックスには、表更新ノードの指定があります。
表更新ノードを編集するには、次の手順を実行します。
名前: 表の名前を表示します。既存の表を選択するには、「表の参照」をクリックし、既存の表を選択します。または、「新規」をクリックして、新しい表を作成できます。
自動入力列の選択: このオプションはデフォルトで選択されています。他の列を選択するには、このオプションの選択を解除します。このオプションの選択を解除した場合は、をクリックして入力列を選択します。矢印を使用して、属性を「使用可能な属性」から「選択された属性」に移動します。
既存の行の削除: このオプションが選択されている場合は、表内の既存の行が削除されてから、表が更新されます。デフォルトでは、このオプションは選択されていません。
列は「データ」グリッドにリストされます。
関連項目
付属の表のすべての属性がリストされます。
新しい表の名前を受け入れるか、別の名前を選択します。
属性を削除するには、をクリックします。
属性を編集するには、をクリックします。
「属性の選択」ダイアログ・ボックスが開きます。
ノードが正常に実行されると、表更新ノード・データ・ビューアでデータを表示できるようになります。
データを表示するには、ノードを右クリックして、「データの表示」を選択します。データ・ビューアは、データ・ソース・ノード・ビューアと同じです。
関連項目
コンテキスト・メニューのオプションは、ノードのタイプによって異なります。様々なタスクを実行したり、ノードに関する情報を表示するためのショートカットが用意されています。
コンテキスト・メニューを表示するには、データ・ソース・ノードを右クリックします。コンテキスト・メニューでは、次のオプションを使用できます。
「プロパティ」ペインで、ノードの特性やプロパティを調査および変更できます。
ノードのプロパティを表示するには、ノードをクリックし、「プロパティ」をクリックします。「プロパティ」ペインが閉じている場合は、「表示」に移動して「プロパティ」をクリックします。または、ノードを右クリックし、「プロパティに移動」をクリックします。
表更新のプロパティは、次のセクションで構成されています。
「列」タブには、更新される表の列が表示されます。各列について、入力名、ターゲット名およびターゲット(データ)タイプが表示されます。
デフォルトでは、「自動入力列の選択」が選択されています。
「自動入力列の選択」の選択を解除した場合は、をクリックして、入力列を手動で選択する必要があります。矢印を使用して、属性を「使用可能な属性」リストから「選択された属性」リストに移動します。
サーバー上のデータが変更された場合、ノードのリフレッシュが必要となる場合があります。リフレッシュするには、をクリックします。
「キャッシュ」セクションには、出力データのキャッシュを生成するオプションがあります。変換プリファレンスを使用して、このデフォルトを変更できます。
次のタスクを実行できます。
出力データのキャッシュ生成による結果表示の最適化: キャッシュを生成する場合は、このオプションを選択します。デフォルト設定では、キャッシュを生成しません。
サンプリング・サイズ: キャッシュを選択したり、デフォルト設定をオーバーライドできます。 デフォルトのサンプリング・サイズは「行数」
です デフォルト値は2000
です
関連項目