データ・エンティティの作業

データ・エンティティは、データ構造を表形式で表したものです。

これには、マッピングで使用できるデータベース表またはビューが含まれます。これらは、単にソースおよびターゲットのメタデータです。データ・フローの作成に使用されます。

次の2つの方法のいずれかで、新しく作成したプロジェクトにデータ・エンティティを追加できます:

「データ・エンティティ」ページに、新しく作成またはインポートしたすべてのデータ・エンティティとその詳細が表示されます。詳細は次のとおりです。

  • データ・エンティティの名前
  • データ・エンティティが作成された接続
  • データ・エンティティが関連付けられているスキーマ
  • 選択したデータ・エンティティの横にある「アクション」アイコン(「アクション」アイコン)をクリックして、次の操作を実行します:
    • 既存の詳細を編集するには、「編集」を選択します。
    • 選択したデータ・エンティティをプレビューするには、「プレビュー」を選択します。データ・エンティティがOracleデータベースに属している場合、表の統計を表示することもできます。詳細は、「データ・エンティティの統計の表示」を参照してください。
    • 選択したデータ・エンティティを削除するには、「削除」を選択します。
  • データ・エンティティを一括で削除するには、「データ・エンティティ」ページで各データ・エンティティのチェック・ボックスを選択して、「削除」をクリックします。
  • 必要なデータ・エンティティを検索して、次のフィルタに基づいてその詳細を確認することもできます:
    • データ・エンティティの名前
    • データ・エンティティが作成された接続
    • データ・エンティティが関連付けられているスキーマ
    • データ・エンティティに関連付けられているタグ

データ・エンティティのインポート

データ・エンティティを作成する最も簡単で一般的な方法は、接続タイプ(Oracleデータベースなど)から構成をインポートすることです。

既存のデータ・エンティティをインポートするには:

  1. ホームページの左側のペインで、「データ・エンティティ」タブをクリックします。

    「データ・エンティティ」ページが表示されます。

  2. 既存のデータ・エンティティをインポートするには、「データ・エンティティのインポート」をクリックします。

    「データ・エンティティのインポート」ページが表示されます。

  3. 「接続」「スキーマ」の順に選択します。最後に、インポートする「オブジェクトのタイプ」を選択します。Oracle Object Storage接続の場合、「スキーマ」ドロップダウンには、接続の作成時にURLで指定したバケットの名前がリストされます。
  4. [Oracle Business Intelligence Cloud Connector (BICC)接続の場合のみ] 「収集用にインポートするサービス」から、データ・ストアをインポートするサービスを選択します。BICCパブリック・ビュー・オブジェクト(PVO)をインポートするには、少なくとも1つのオファリングを選択する必要があります。
    ノート

    選択したオブジェクトの数によっては、BICC PVOのインポートに長時間かかる場合があります。パフォーマンスを向上させるために、Oracleでは、インポートするPVOの数をフィルタおよび制限するためにマスクを使用することをお薦めします。
  5. スキーマ内の一部のオブジェクトのみをインポートする場合は、「マスク」フィルタを選択します。

    「接続タイプ」に応じて、追加のインポート・オプションが表示されます。

    ノート

    Oracle Object Storage接続の場合、この値は大文字と小文字が区別されます。類似ファイルのバッチ処理Trueに設定されている場合、マスクと一致し、同じ構造を持つすべてのファイルが1つのデータ・エンティティにグループ化されます。
  6. [Oracle Financials Cloud接続の場合のみ]「リソース」セクションのリストから、インポートするアイテムを選択します。インポート・プロセスが完了すると、選択したリソースごとに表が作成されます。
  7. [For REST server connections only] In the Resources section, do the following:
    • リソースURIフィールドに、リソースのインポート元となるRESTサービスのURLを入力します。
    • +アイコンをクリックします。
    • 「名前」列にリソースの識別子を入力します。
    • 操作URI列に、リソースのURIを入力します。
    • 「リソースのテスト」をクリックして、エントリが有効かどうかを確認します。
  8. 「起動」をクリックします

    ジョブが作成され、セッション追跡のために対応するジョブIDが表示されます。ジョブIDをクリックすると、そのジョブの詳細が表示されます。

    ジョブの実行に成功すると、選択したすべてのデータ・エンティティがインポートされます。「データ・エンティティ」ページの右隅にある「リフレッシュ」アイコン「リフレッシュ」アイコンをクリックすると、新しくインポートしたデータ・エンティティが表示されます。

データ・エンティティの作成

Oracle Data Transformsインタフェースでデータ・エンティティを作成または更新できます。

データ・エンティティは、データ・フローでソースとして使用される対応するオブジェクトをソース接続内に所有している必要があります。通常、インポート・プロセスで、これらのオブジェクトが調整されていることを確認します。ただし、データ・エンティティを作成または更新するときには必ず、両方の定義が互いに調整されているかどうかを確認してください。

データ・エンティティをターゲットとして使用する場合は、ターゲット接続にそれがすでに存在している必要はなく、データ・フロー実行の一部として作成できます。

新しいデータ・エンティティを作成するには:
  1. ホームページの左側のペインで、「データ・エンティティ」タブをクリックします。

    「データ・エンティティ」ページが表示されます。

  2. 新しいデータ・エンティティを作成するには、「データ・エンティティの作成」をクリックします。

    「データ・エンティティの作成」ページが表示されます。

  3. 「名前」テキスト・ボックスに、作成する新しいデータ・エンティティの名前を入力します。
  4. 「接続」ドロップダウンから、新しく作成したデータ・エンティティの追加元となる必要な接続を選択します。
    ノート

    Oracle Financials Cloud接続のデータ・エンティティは手動で作成できないため、この接続はここにリストされません。「データ・エンティティのインポート」ページを使用してインポートできるのは、Oracle Financials Cloud RESTエンドポイントからのみです。データ・エンティティのインポートを参照してください。
  5. 「スキーマ」ドロップダウンに、選択した接続に対応するすべてのスキーマが2つのグループにリストされます。
    • 「新規データベース・スキーマ」(以前にインポートしていないもの)と、
    • 既存のデータベース・スキーマ(以前にインポートされ、データ・エンティティを置換する可能性があるもの)です。

    「スキーマ」ドロップダウンから、必要なスキーマを選択します。

    ノート

    Oracle Object Storage接続の場合、「スキーマ」ドロップダウンには、接続の作成時にURLで指定したバケットの名前がリストされます。
  6. 「タイプ」ドロップダウンから、データ・エンティティ・タイプを選択します。
    • : 新しく作成したデータ・エンティティの表構造を定義するには、「+」アイコンをクリックして列を追加します。列ごとに、名前、データ型、長さ、スケール、Null以外のパラメータを指定できます。セルをダブルクリックして、値を構成します。

      行を削除するには、「x」アイコンをクリックします。表の行をソートするには、上矢印および下矢印をクリックします。

    • インライン・ビュー: 「問合せ」タブにSelect文を入力して、インライン・コードを使用してデータ・エンティティを作成します。たとえば、SELECT * FROM CUSTOMERとします。「検証」をクリックします

      「列」タブには、問合せが返す列の読取り専用リストが表示されます。「プレビュー」タブをクリックして、列データを確認します。

  7. 「タグ」テキスト・ボックスに、任意のタグを入力します。タグを使用して、「データ・エンティティ」ページに表示されるデータ・エンティティをフィルタできます。
  8. Oracle Object Storage接続の場合、このページには次のオプションが表示されます:
    • コンテンツ - インポートするデータが含まれているCSVファイルを選択します。列のデータ型や長さなど、プレビュー表に表示されるメタデータは、CSVファイルの最初の行に基づきます。CSVファイルにヘッダー行があることを確認してください。ヘッダーに使用できるのは英数字のみで、特殊文字は使用できません。
    • ファイルのグループ化 - 複数のCSVファイルのデータを1つのデータ・エンティティにグループ分けする場合は、このチェック・ボックスを選択します。たとえば、Employee_Data1.csv、Employee_Data2.csvおよびEmployee_Data3.csvのデータを1つのデータ・エンティティにマージする場合などです。

      Windowsを使用してCSVファイルをアップロードする場合は、最初にファイルをUnix形式に変換して、グループ化中に文字エンコーディングの問題を回避してください。

    • リソース名 - このオプションは「ファイルのグループ化」とともに使用します。ファイルの識別に使用する値を入力します。リソース名は正規表現である必要があります。リソース名にはワイルドカード文字としてアスタリスク(*)のみを使用できます。たとえば、Employee_Data*.csvです。
  9. Oracleデータベース接続の場合、データ・エンティティを機能グループとしてマークできます。「拡張オプション」を開き、「機能グループとして処理」チェック・ボックスを選択します。
  10. 「保存」をクリックします

    新しいデータ・エンティティが作成されます。

データ・フロー・エディタ内でのデータ・エンティティの作成

ターゲット・データ・エンティティをすでに作成またはインポートしている場合は、そのデータ・エンティティをデザイン・キャンバス上にドラッグし、列マッピングおよびオプションを完了します。

データ・フロー・エディタで新しいターゲット表の定義を作成するには、

  1. データ・フローの最後でコンポーネントを選択します。
  2. ターゲット・コンポーネントの右上隅にある「データ・エンティティの追加」アイコン「データ・エンティティの追加」アイコンをクリックします。
  3. 「データ・エンティティの追加」ページが表示され、ターゲット・コンポーネントの次の詳細を構成できます:

    「一般」タブ

    • 「名前」テキスト・ボックスに、新しく作成したデータ・エンティティの名前を入力します。
    • 「別名」テキスト・ボックスには、新しく作成したデータ・エンティティの名前が自動的に移入されます。
    • 「接続タイプ」ドロップダウンから、新しく作成したデータ・エンティティの追加元となる必要な接続を選択します。
    • 接続の作成時に作成されたサーバー名がロードされます。「サーバー」ドロップダウンから、新しく作成したデータ・エンティティの追加元となる必要なサーバー名を選択します。
    • 「スキーマ」ドロップダウンから、必要なスキーマを選択します。
    • 「次へ」をクリックします

    「列」タブ

    これにより、列定義を作成、削除または編集できます。

    • 新しく作成したデータ・エンティティに新しい列を追加するには、「列の追加」アイコン「列の追加」アイコンをクリックします。

      表示されている表に新しい列が追加されます。

    • この表には、次の列が表示されます:
      • 名前
      • データ型- セルをクリックして、必要なデータ型を構成します。
      • スケール
      • 長さ
      • アクション- 作成した列を削除するには、クロス・アイコンをクリックします。
    • 列を一括で削除するには、列を選択して削除アイコン「削除」アイコンをクリックします。
    • 必要な列詳細を検索するには、「検索」テキスト・ボックスに必要な列名を入力し、[Enter]を押します。必要な列の詳細が表示されます。
    • 「次へ」をクリックします

    「データ・エンティティのプレビュー」タブ

    これには、作成したすべての列とその構成済の詳細のプレビューが表示されます。データ・エンティティがOracleデータベースに属している場合、表の統計を表示することもできます。詳細は、「データ・エンティティの統計の表示」を参照してください。

  4. 「保存」をクリックします

    新しいターゲット・データ・エンティティが作成されます。

  5. 右ペインでプロパティ・パネルを展開すると、作成したコンポーネントの次の設定が表示されます:
    • 一般- コンポーネントの名前が、その接続およびスキーマの詳細とともに表示されます。
    • 属性- コンポーネントに関連付けられたすべての属性の詳細が表示されます。
    • 列マッピング- 「自動マップ」をクリックすると、すべての列が自動的にマップされます。
    • プレビュー- クリックすると、コンポーネントのプレビューが表示されます。
    • オプション- 必要に応じてオプションを変更します。

データ・エンティティの表示

「プレビュー」タブには、各データ・エンティティの詳細な統計が表示されます。

ノート

この機能を使用できるのはOracleデータベース表のみです。
選択したデータ・エンティティの統計は、次のいずれかの方法で表示できます:
  • 「データ・エンティティ」リストの横にある「アクション」アイコン(「アクション」アイコン)をクリックし、「プレビュー」をクリックします。「統計」タブを選択して、選択したデータ・エンティティの統計を表示します。
  • 任意のデータ・フローで、ソースまたはターゲットのデータ・エンティティをクリックし、右ペインで「プロパティ」パネルを開きます。「プレビュー」をクリックします。

統計データは次のように表示されます:

  • データ・エンティティの行と列の合計数は、上部に表示されます。
  • 統計パネルには、各列のサムネイル・グラフが「最小」、「最大」、「個別」および「NULL」の値に関する情報とともに表示されます。
  • ヒストグラムに基づいて、2つのタイプのサムネイル表現が表示されます:
    • 棒グラフは、頻度ヒストグラムおよび上位頻度ヒストグラムのデータを表します。棒グラフには、表の行数の最初の上位10個の値が表示されます。
    • 表には、ハイブリッド・ヒストグラムと高さ調整ヒストグラムのデータがリストされます。表にはデータ全体が表示され、スクロール可能です。表には、値の範囲と各範囲内の行の割合が表示されます。
  • 各サムネイルをクリックすると、新しいブラウザ・タブで列の統計を表示できます。
  • 各チャートの詳細ビューには、ヒストグラムのタイプも表示されます。