データ・ロードの作成および実行

データ・ロードを使用すると、ソース接続からターゲット接続に複数のデータ・エンティティをロードできます。

トピック

データ・ロードの作成

データ・ロードの作成ウィザードを使用して、データ・ロードのソース接続とターゲット接続を定義します。

ノート

Oracle Object Storage接続でのデータ・ロードはサポートされていません。

ウィザードでは、デプロイメント・タイプに基づいてロード処理オプションを選択することもできます。新しく作成されたデータ・ロードが、関連付けられたプロジェクトの「データ・ロード」ページに表示されます。選択したデータ・ロードの横にある「アクション」アイコン([アクション]アイコン)をクリックして、編集、名前変更、開始、エクスポートまたは削除します。

ホーム・ページからデータ・ロードを作成するには:

  1. 次のいずれかを行います。
    • ホーム・ページで、「データのロード」をクリックします。「データ・ロードの作成」ウィザードが表示されます。

      「データ・ロードの作成」タブで、デフォルト値を置換する場合は名前を入力し、摘要を追加してドロップダウンからプロジェクトを選択します。

    • ホーム・ページで「プロジェクト」をクリックし、必要なプロジェクト・タイルを選択します。左側のペインで、「データ・ロード」をクリックし、「データ・ロードの作成」をクリックします。

    「データ・ロードの作成」ウィザードが表示されます。

  2. 「名前」フィールドに、データ・ロードの名前を入力します。フィールドにはデフォルト名が事前に移入されています。この値は編集可能です。
  3. 説明を追加します。これはオプションです。
  4. 「ホーム」ページから「データ・ロードの作成」ウィザードを開いた場合は、ドロップダウンからプロジェクト名を選択する必要があります。ここが初めての場合は、「+」アイコンをクリックしてプロジェクトを作成します。SUPERVISORとしてログインしている場合、デフォルトのプロジェクト名はHomeです。その他のユーザーの場合、デフォルトのプロジェクト名の形式は<username>_Homeです。デフォルト値は編集できます。プロジェクトの詳細は、プロジェクトの使用を参照してください。
  5. 「ロード処理」で、次のいずれかを実行します:
    • 「内部」ラジオ・ボタンを選択し、「デプロイメント・タイプ」ドロップダウンから「データ変換(バッチ)」を選択します。
    • 「委任」ラジオ・ボタンを選択し、「デプロイメント・タイプ」ドロップダウンからOCI GoldenGateを選択します。GoldenGate「デプロイメント接続」ドロップダウンから接続を選択します。
  6. 「次へ」をクリックします。
  7. ソース接続を定義するには、「接続」ドロップダウンから、データ・エンティティの追加先となる必要な接続を選択してください。または、「+」アイコンをクリックして新しい接続を作成します。接続の詳細は、接続の使用を参照してください。
  8. 「スキーマ」ドロップダウンで、選択した接続に対応するすべてのスキーマが2つのグループで表示されます:
    • 既存のスキーマ(Oracle Data Transformsにインポートしたスキーマ)および
    • 新規データベース・スキーマ(まだインポートしていないスキーマ)。
    使用するスキーマをドロップダウンから選択します。
    ノート

    ユーザー名やパスワードが指定されていない、ウォレットが欠落しているなど、情報が欠落している場合は、「この接続には、不足している情報があります。」というエラーが表示され、「リストの移入に失敗する可能性があります。「編集」アイコン(「編集」アイコン)をクリックすると、接続の更新ページを開いて、欠落している詳細を入力できます。
  9. 「次へ」をクリックします。
  10. 同様に、ターゲット接続を定義します。Apache Iceberg接続をターゲットとして使用してデータをロードする場合は、「Apache Icebergデータ・ロードの作成と実行」で具体的な手順を参照してください。
  11. 「保存」をクリックします。

    「データ・ロードの詳細」ページが表示され、ロードされたすべてのデータ・エンティティがリストされます。

データ・ロードの実行

データ・ロードを作成すると、データ・ロードの実行に必要な詳細が表示される「データ・ロードの詳細」ページに移動します。

これには、ソース・スキーマの詳細、ソース・スキーマからロードされたデータ・エンティティ、およびターゲット・スキーマの詳細が含まれます。各データ・エンティティに適用するアクション(再作成、切捨て、追加)を選択して、ターゲット・スキーマに表をバルク・ロードできます。データ・ロードを実行すると、リクエストを完了するために複数のジョブがバックグラウンドで実行されます。

データ・ロードは、次のいずれかの方法で実行できます:

ノート

Oracle Object Storage接続でのデータ・ロードはサポートされていません。

「データ・ロードの詳細」ページからのデータ・ロードの実行

「データ・ロードの詳細」ページには、データ・ロードの実行に必要な情報が表示されます。ターゲット・スキーマにロードする前に、データ・エンティティに様々なアクション(増分マージ、増分追加、再作成、切捨て、追加)を適用できます。

ノート

適用先: 適用可能 Data Integrator: Web Editionというマーケットプレイスで別個のリストとして利用できるデータ変換。

データ・ロードが大規模な場合は、問題を回避するためにODIエージェントのメモリーを増やすことが必要になる場合があります。データ・ロードの実行を開始する前に、ODIエージェントのメモリーの増加の手順に従います。

「データ・ロードの詳細」ページからデータ・ロードを実行するには:

  1. 「データ・ロードの詳細」ページで、ターゲット・スキーマに移動するデータ・エンティティを選択します。
    リストをフィルタするには、次のいずれかを実行します:
    • 「名前」テキスト・ボックスに、名前または名前の部分を入力します。この検索では、指定した文字列が名前に含まれるデータ・エンティティが返されます。たとえば、検索文字列ADでは、ADMIN、ADDRESS、BADGE、UPGRADE、WORKLOADなどの結果が返されます。
    • パターン一致を使用して特定の文字列を検索するには、正規表現の使用トグルをオンにします。たとえば、検索文字列CO.*では、CONTACT、COUNT、COUNTRYなどの結果が返されます。
    複数のデータ・エンティティを選択して、ターゲット・スキーマにロードできます。次のオプションを使用して、表示されるリストをソートすることもできます:
    • すべて - 検索基準に一致するすべてのデータ・エンティティが表示されます。
    • 選択済 - 選択したすべての行が表示されます。
    • 未選択 - 選択していないすべての行が表示されます。
    • 無効 - すべての無効な行が表示されます。
    ノート

    これらのオプションでは、検索基準に基づいてデータ・エンティティのリストが表示されます。すべてのデータ・エンティティのリストを表示するには、適用されているフィルタをすべてクリアします。
  2. 必要なアイコンをクリックして、次のいずれかのアクションを選択します:
    • 増分マージ- 指定したマージ・キーに基づいてソース表をターゲット表と比較することで、選択した列のデータを更新します。このオプションを使用するには、マージする列を選択し、マージ・キーを選択します。このオプションを使用するには、マージする列を選択し、マージ・キーを選択します。「検証」アイコン(「検証」アイコン)をクリックして、選択した値を検証します。
      ノート

      • 増分列の最終更新値は、データ・ロードに格納されます。同じ表を使用して新しいデータ・ロードを作成する場合、このオプションは、初めて実行したときに「追加」、「切捨て」および「再作成」のように機能します。
      • ターゲット表が切り捨てられていない場合は、「追加」、「切捨て」または「再作成」モードを使用してデータ・ロードを開始してから、アクションを「増分マージ」に切り替えてください。これにより、ターゲット表のすべての既存の行が更新されます。Oracleでは、「増分マージ」処理を使用してデータ・ロードを開始することをお薦めします。
    • 増分追加 - ターゲット・スキーマの選択した列のデータを更新します。このオプションを使用するには、更新する列を選択し、「検証」アイコン(「検証」アイコン)をクリックして選択を検証します。

      データ・ロードを初めて実行する場合、このオプションは「追加」、「切捨て」および「再作成」オプションと同様に機能します。つまり、すべての行がターゲットに挿入されます。後続のすべてのデータ・ロード実行で、増分列を使用して新しい行のみをフィルタし、同じ行が複数回ロードされないようにデータを追加します。

      ノート

      • 増分列の最終更新値は、データ・ロードに格納されます。同じ表を使用して新しいデータ・ロードを作成する場合、このオプションは、初めて実行したときに「追加」、「切捨て」および「再作成」のように機能します。
      • ターゲット表が切り捨てられていない場合は、「追加」、「切捨て」または「再作成」モードを使用してデータ・ロードを開始してから、アクションを「増分追加」に切り替えてください。Oracleでは、「増分追加」処理を使用してデータ・ロードを開始することをお薦めします。
    • 再作成 – 表がターゲット・スキーマにすでに存在する場合は、既存の表を削除して再作成します。
      ノート

      このオプションは、OCI GoldenGateを使用してロードされるデータ・エンティティでは使用できません。
    • 切捨て – 表がターゲット・スキーマにすでに存在する場合は、選択した表からすべてのデータを削除します。何もドロップされません。
      ノート

      デルタ共有データ・ロードの場合、「データ・ロードの詳細」ページには「実行」アイコンオプションのみが含まれます。ターゲット・スキーマにロードする前に、データ・エンティティに様々なアクション(増分マージ、増分追加、再作成、切捨て、追加)を適用することはできません。これは、デルタ共有サーバーとターゲット・スキーマ間でデータが一貫していることを確認するためです。
    • 追加 – データセットのすべての行をターゲットに挿入します。データセットにターゲットにすでに存在するレコードが含まれている場合、重複するレコードがあります。ソース・データセットがターゲット内の新規レコードまたは重複行のみを持つことが予想される場合は、「追加」を使用します。
    • ロードしない – データ・ロード・ジョブから、選択したデータ・エンティティをスキップします。「保存」をクリックすると、これらのデータ・エンティティは、今後のデータ・ロード・ジョブで使用できなくなります。

    複数のデータ・エンティティを選択して、異なるアクションを適用できます。保存されていない行は太字で強調表示されます。

    ノート

    これらのオプションは、デルタ共有接続には使用できません。
  3. ソース列名をターゲット表に格納する方法を指定するには、「データ・ロードの詳細」ページの右側にある「設定」をクリックします。次のいずれかを選択します:
    • すべての名前をデリミタで囲んで元の名前を保持 - ターゲット表のソース表と同じ名前の列名を作成します。
    • デリミタを使用しない - デフォルトで選択されています。すべての列名を大文字に変換し、スペースおよび特殊文字をアンダースコアで置き換えます。

      次のオプションは、DateTimestampStartなどの予約語に適用されます。

      • デリミタで囲む - デフォルトで選択されています。予約語である列名をデリミタで囲みます(すべての列名ではありません)。
      • 接頭辞の使用 - (すべての列の名前ではなく)予約語である列の名前に、指定された接頭辞を追加します。

      変換後に同じ名前を持つ列名の場合、一意性を維持するために、名前には数値の接尾辞が付きます。例: 列名

      DatedateDATEItem_@CodeItem$$CodeItem%%Code

      次のようにターゲット表に作成されます。

      DATEDATE_0DATE_1ITEM__CODEITEM__CODE_0ITEM__CODE_1

    ノート

    データ・ロードを実行すると、選択したオプションが適用され、後続のすべての実行で保持されます。構成は変更できません。
  4. 保存アイコンをクリックして変更を保存します。行の緑色のチェックマーク(緑色のチェックマーク・アイコン)は、変更が保存されていることを示します。
  5. データ・ロードを開始するには、
    • 「実行」アイコンをクリックします。
    • GoldenGateデータ・ロードでは、「デプロイ」アイコンをクリックします。

    データ・ロードが正常に開始されると、確認プロンプトが表示されます。

データ・ロードのステータスを確認するには、ターゲット・スキーマの詳細のすぐ下にある「ステータス」パネルを参照します。「ステータス」パネルの詳細は、「データ・ロード、データ・フローおよびワークフローのステータスのモニター」を参照してください。このパネルには、このデータ・ロードを実行するために実行されるジョブへのリンクが表示されます。「ジョブの詳細」ページで進行状況をモニターするには、リンクをクリックします。ジョブの詳細は、「ジョブの作成および管理」を参照してください。

「ワークフローの詳細」ページからのデータ・ロードの実行

データ・フローまたはワークフローとともに複数のデータ・ロードをワークフローに追加し、個別のステップとして実行できます。「ワークフローの詳細」ページの左側のパネルには、使用可能なデータ・フロー、ワークフローおよびデータ・ロードがリストされます。

データ・ロードの場合、左側のパネルには次の2つのフォルダが示されます:
  • データ・ロード - このフォルダには、ローカル・データ変換インスタンスで作成したすべてのデータ・ロードが示されています。ローカル・データ・ロードであるワークフローのステップを選択すると、デザイン・キャンバスの右側にある「プロパティ」パネルで、「タイプ」には「データ・ロード」、「リンクされたオブジェクト」には「ホーム > <nameofDataLoad>」と表示されます。
  • リモート・データ・ロード - このフォルダには、リモート・データ変換インスタンスで作成したすべてのデータ・ロードが示されています。リモート・データ・ロード用のデータ変換接続の作成を参照してください。リモート・データ・ロードであるワークフローのステップを選択すると、デザイン・キャンバスの右側にある「プロパティ」パネルで、「タイプ」には「リモート・データ・ロード」、「リンクされたオブジェクト」には「データ変換接続の名前 > <nameofDataLoad>」と表示されます。

データ・ロードをワークフローに追加したら、「実行」アイコンをクリックして実行します。