14.6 データ・エンティティの使用

データ・エンティティは、データ構造を表形式で表したものです。

これには、マッピングでソースまたはターゲットとして使用できるデータベース表またはビューが含まれます。これらは、ソースおよびターゲットのメタデータにすぎません。データ・フローの作成に使用されます。

次の2つの方法のいずれかで、新しく作成したプロジェクトにデータ・エンティティを追加できます:

「データ・エンティティ」ページに、新しく作成またはインポートしたすべてのデータ・エンティティとその詳細が表示されます。詳細は、次のとおりです:

  • データ・エンティティの名前
  • データ・エンティティが作成された接続
  • データ・エンティティが関連付けられているスキーマ
  • 選択したデータ・エンティティの横にある「アクション」アイコン(「アクション」アイコン)をクリックして、次の操作を実行します:
    • 既存の詳細を編集するには、「編集」を選択します。
    • 選択したデータ・エンティティをプレビューするには、「プレビュー」を選択します。データ・エンティティがOracleデータベースに属している場合、表の統計を表示することもできます。詳細は、「データ・エンティティの統計の表示」を参照してください。
    • 選択したデータ・エンティティを削除するには、「削除」を選択します。
  • データ・エンティティを一括で削除するには、「データ・エンティティ」ページで、各データ・エンティティのチェック・ボックスを選択して、「削除」をクリックします。
  • 必要なデータ・エンティティを検索して、次のフィルタに基づいてその詳細を確認することもできます:
    • データ・エンティティの名前
    • データ・エンティティが作成された接続
    • データ・エンティティが関連付けられているスキーマ
    • データ・エンティティに関連付けられているタグ

14.6.1 データ・エンティティのインポート

データ・エンティティを作成する最も簡単で一般的な方法は、接続タイプ(Oracleデータベースなど)からその構造をインポートすることです。

既存のデータ・エンティティをインポートするには:

  1. ホームページの左側のペインで、「データ・エンティティ」タブをクリックします。

    「データ・エンティティ」ページが表示されます。

  2. 「データ・エンティティのインポート」をクリックして、既存のデータ・エンティティをインポートします。

    「データ・エンティティのインポート」ページが表示されます。

  3. 「接続」「スキーマ」の順に選択し、最後に、インポートする「オブジェクトのタイプ」を選択します。Oracle Object Storage接続の場合、「スキーマ」ドロップダウンには、接続の作成時にURLで指定したバケットの名前がリストされます。
  4. [Oracle Business Intelligence Cloud Connector (BICC)接続の場合のみ] 「収集用にインポートするオファリング」から、データ・ストアをインポートするオファリングを選択します。BICCパブリック・ビュー・オブジェクト(PVO)をインポートするには、オファリングを少なくとも1つ選択する必要があります。

    ノート:

    選択したオブジェクトの数によっては、BICC PVOのインポートに長時間かかる場合があります。パフォーマンスを向上させるために、マスクを使用してインポートするPVOの数をフィルタおよび制限することをお薦めします。
  5. スキーマ内の一部のオブジェクトのみをインポートする場合は、「マスク」フィルタを選択します。

    「接続タイプ」に応じて、追加のインポート・オプションが表示されます。

    ノート:

    Oracle Object Storage接続の場合、この値は大/小文字が区別されます。「類似ファイルのバッチ処理」「True」に設定されている場合、マスクと一致し、同じ構造を持つすべてのファイルが1つのデータ・エンティティにグループ化されます。
  6. [Oracle Financials Cloud接続の場合のみ] 「リソース」セクションのリストから、インポートするアイテムを選択します。インポート・プロセスが完了すると、選択したリソースごとに表が作成されます。
  7. [RESTサーバー接続の場合のみ] 「リソース」セクションで、次を実行します:
    • リソースURIフィールドに、リソースのインポート元となるRESTサービスのURLを入力します。
    • 「+」アイコンをクリックします。
    • 「名前」列に、リソースの識別子を入力します。
    • 操作URI列に、リソースのURIを入力します。
    • 「リソースのテスト」をクリックして、エントリが有効かどうかを確認します。
  8. 「開始」をクリックします。

    ジョブが作成され、セッション追跡のために対応するジョブIDが表示されます。ジョブIDをクリックすると、そのジョブの詳細が表示されます。

    ジョブが正常に実行されると、選択したすべてのデータ・エンティティがインポートされます。「データ・エンティティ」ページの右隅にある「リフレッシュ」アイコン「リフレッシュ」アイコンをクリックすると、新しくインポートしたデータ・エンティティが表示されます。

14.6.2 データ・エンティティの作成

Oracle Data Transformsインタフェースでデータ・エンティティを手動で作成または更新できます。

データ・エンティティは、データ・フローでソースとして使用される対応するオブジェクトをソース接続内に所有している必要があります。通常、インポート・プロセスで、これらのオブジェクトが調整されていることが確認されます。ただし、データ・エンティティを作成または更新するときには必ず、両方の定義が互いに調整されているかどうかを確認してください。

データ・エンティティをターゲットとして使用する場合は、ターゲット接続にそれがすでに存在している必要はなく、データ・フロー実行の一部として作成できます。

新しいデータ・エンティティを作成するには:
  1. ホームページの左側のペインで、「データ・エンティティ」タブをクリックします。

    「データ・エンティティ」ページが表示されます。

  2. 「データ・エンティティの作成」をクリックして、新しいデータ・エンティティを作成します。

    「データ・エンティティの作成」ページが表示されます。

  3. 「名前」テキスト・ボックスに、作成する新しいデータ・エンティティの名前を入力します。
  4. 「作成」ドロップダウンから、新しく作成したデータ・エンティティの追加元となる必要な接続を選択します。

    ノート:

    Oracle Financials Cloud接続のデータ・エンティティは手動で作成できないため、この接続はここにリストされません。データ・エンティティは、「データ・エンティティのインポート」ページを使用してOracle Financials Cloud RESTエンドポイントからのみインポートできます。「データ・エンティティのインポート」を参照してください。
  5. 「スキーマ」ドロップダウンに、選択した接続に対応するすべてのスキーマが2つのグループで表示されます。
    • 「新規データベース・スキーマ」(以前にインポートしたことがないもの)と、
    • 既存のデータベース・スキーマ(以前にインポートされて、データ・エンティティを置換する可能性があるもの)です。

    「スキーマ」ドロップダウンから、必要なスキーマを選択します。

    ノート:

    Oracle Object Storage接続の場合、「スキーマ」ドロップダウンには、接続の作成時にURLで指定したバケットの名前がリストされます。
  6. 「タイプ」ドロップダウンから、データ・エンティティ・タイプを選択します。
    • : 新しく作成したデータ・エンティティの表構造を定義するには、「+」アイコンをクリックして列を追加します。列ごとに、「名前」、「データ型」、「長さ」、「スケール」、「Null以外」などのパラメータを指定できます。セルをダブルクリックして、値を構成します。

      行を削除するには、「x」アイコンをクリックします。表の行をソートするには、上矢印および下矢印をクリックします。

    • インライン・ビュー: インライン・コードを使用してデータ・エンティティを作成するには、「問合せ」タブにSelect文を入力します。たとえば、SELECT * FROM CUSTOMERとします。「検証」をクリックします。

      「列」タブには、問合せが返す列の読取り専用リストが表示されます。「プレビュー」タブをクリックして、列データを確認します。

  7. 「タグ」テキスト・ボックスに、希望するタグを入力します。タグを使用して、「データ・エンティティ」ページに表示されるデータ・エンティティをフィルタできます。
  8. Oracle Object Storage接続の場合、このページには次のオプションが表示されます:
    • 内容 - インポートするデータが含まれているCSVファイルを選択します。列のデータ型や長さなど、プレビュー表に表示されるメタデータは、CSVファイルの最初の行に基づきます。CSVファイルにヘッダー行があることを確認してください。ヘッダーに使用できるのは英数字のみで、特殊文字は使用できません。
    • ファイルのグループ化 - 複数のCSVファイルのデータを1つのデータ・エンティティにグループ化する場合は、このチェック・ボックスを選択します。たとえば、Employee_Data1.csv、Employee_Data2.csvおよびEmployee_Data3.csvのデータを1つのデータ・エンティティにマージする場合などです。
    • リソース名 - このオプションは「ファイルのグループ化」とともに使用します。ファイルの識別に使用する値を入力します。リソース名は正規表現である必要があります。リソース名にはワイルドカード文字としてアスタリスク(*)のみを使用できます。たとえば、Employee_Data*.csvです。
  9. Oracleデータベース接続の場合、データ・エンティティを機能グループとしてマークできます。「拡張オプション」を開き、「機能グループとして処理」チェック・ボックスをクリックします。
  10. 「保存」をクリックします。

    新しいデータ・エンティティが作成されます。

14.6.3 データ・フロー・エディタ内でのデータ・エンティティの作成

ターゲット・データ・エンティティをすでに作成またはインポートしている場合は、そのデータ・エンティティをデザイン・キャンバス上にドラッグし、列マッピングおよびオプションを完了します。

データ・フロー・エディタで新しいターゲット表の定義を作成するには、

  1. データ・フローの最後でコンポーネントを選択します。
  2. ターゲット・コンポーネントの右上隅にある「データ・エンティティの追加」アイコン「データ・エンティティの追加」アイコンをクリックします。
  3. 「データ・エンティティの追加」ページが表示され、ターゲット・コンポーネントの次の詳細を構成できます:

    「一般」タブ

    • 「名前」テキスト・ボックスに、新しく作成したデータ・エンティティの名前を入力します。
    • 「別名」テキスト・ボックスには、新しく作成したデータ・エンティティの名前が自動入力されます。
    • 「接続タイプ」ドロップダウンから、新しく作成したデータ・エンティティの追加元となる必要な接続を選択します。
    • 接続の作成時に作成されたサーバー名がロードされます。「サーバー」ドロップダウンから、新しく作成したデータ・エンティティの追加元となる必要なサーバー名を選択します。
    • 「スキーマ」ドロップダウンから、必要なスキーマを選択します。
    • 「次」をクリックします。

    「列」タブ

    これにより、列定義を作成、削除または編集できます。

    • 新しく作成したデータ・エンティティに新しい列を追加するには、「列の追加」アイコン「列の追加」アイコンをクリックします。

      表示されている表に新しい列が追加されます。

    • この表には次の列が表示されます:
      • 名前
      • データ型 - セルをクリックして、必要なデータ型を構成します。
      • スケール
      • 長さ
      • アクション - 作成した列を削除するには、クロス・アイコンをクリックします。
    • 列を一括で削除するには、列を選択して「削除」アイコン 「削除」アイコンをクリックします。
    • 必要な列詳細を検索するには、「検索」テキスト・ボックスに必要な列名を入力し、[Enter]を押します。必要な列の詳細が表示されます。
    • 「次」をクリックします。

    「データ・エンティティのプレビュー」タブ

    作成したすべての列とその構成済の詳細のプレビューが表示されます。データ・エンティティがOracleデータベースに属している場合、表の統計を表示することもできます。詳細は、「データ・エンティティの統計の表示」を参照してください。

  4. 「保存」をクリックします。

    新しいターゲット・データ・エンティティが作成されます。

  5. 右側のペインでプロパティ・パネルを展開すると、作成したコンポーネントの次の設定が表示されます:
    • 一般 - コンポーネントの名前が、その接続およびスキーマの詳細とともに表示されます。
    • 属性 - コンポーネントに関連付けられたすべての属性の詳細が表示されます。
    • 列マッピング - 「自動マップ」をクリックすると、すべての列が自動的にマップされます。
    • プレビュー - クリックすると、コンポーネントのプレビューが表示されます。
    • オプション - 必要に応じてオプションを変更します。

14.6.4 データ・エンティティの統計の表示

「プレビュー」タブには、各データ・エンティティの詳細な統計が表示されます。

ノート:

この機能を使用できるのは、Oracleデータベース表のみです。
選択したデータ・エンティティの統計は、次のいずれかの方法で表示できます:
  • 「データ・エンティティ」リストで、データ・エンティティの横にある「アクション」アイコン(「アクション」アイコン)をクリックし、「プレビュー」をクリックします。「統計」タブを選択して、選択したデータ・エンティティの統計を表示します。
  • 任意のデータ・フローで、ソースまたはターゲットのデータ・エンティティをクリックし、右側のペインで「プロパティ」パネルを開きます。「プレビュー」をクリックします。

統計データは次のように表示されます:

  • データ・エンティティの行と列の合計数は、上部に表示されます。
  • 統計パネルには、各列のサムネイル・グラフが、最小値、最大値、個別値およびNULL値に関する情報とともに表示されます。
  • ヒストグラムに基づいて、2つのタイプのサムネイル表現が表示されます:
    • 棒グラフは、頻度ヒストグラムおよび上位頻度ヒストグラムのデータを表します。棒グラフには、表の行数について最初の上位10個の値が表示されます。
    • 表には、ハイブリッド・ヒストグラムと高さ調整済ヒストグラムのデータがリストされます。表にはデータ全体が表示され、スクロール可能です。表には、値の範囲と各範囲内の行の割合が表示されます。
  • 各サムネイルをクリックすると、新しいブラウザ・タブで列の統計を表示できます。
  • 各チャートの詳細ビューには、ヒストグラムのタイプも表示されます。