データ・ロード
この項では、データ・ロードを作成および実行する手順について説明します。
トピック:
データ・ロードの作成
データ・ロードを使用すると、ソース接続からターゲット接続に複数のデータ・エンティティをロードできます。
データ・ロードは、次のいずれかの方法で作成できます:
ノート:
Oracle Object Storage接続でのデータ・ロードはサポートされていません。新しく作成されたデータ・ロードが、関連付けられたプロジェクトの「データ・ロード」ページに表示されます。選択したデータ・ロードの横にある「アクション」アイコン()をクリックして、編集、名前変更、開始、エクスポートまたは削除します。
ホーム・ページからのデータ・ロードの作成
この項では、データ・ロードを作成する一般的なステップについて説明します。OCI GoldenGateを使用してデータをロードおよび変換する予定の場合は、「プロジェクト」ページを使用してデータ・ロードを作成します。「「プロジェクト」ページからのデータ・ロードの作成」を参照してください。
ホーム・ページからデータ・ロードを作成するには:
- 左側のペインで、「ホーム」タブをクリックします。「データのロード」をクリックします。
「データ・ロードの作成」ウィザードが表示されます。
- 「名前」フィールドに、データ・ロードの名前を入力します。フィールドにはデフォルト名が事前に移入されています。この値は編集可能です。
- 説明を追加します。これはオプションです。
- ドロップダウンからプロジェクト名を選択します。ここが初めての場合は、「+」アイコンをクリックしてプロジェクトを作成します。SUPERVISORとしてログインしている場合、デフォルトのプロジェクト名は
Home
です。その他のユーザーの場合、デフォルトのプロジェクト名の形式は<username>_Home
です。デフォルト値は編集できます。プロジェクトの詳細は、プロジェクトの使用を参照してください。 - 「次」をクリックします。
- ソース接続を定義するには、「接続」ドロップダウンから、データ・エンティティの追加元となる必要な接続を選択します。または、「+」アイコンをクリックして新しい接続を作成します。接続の詳細は、接続の使用を参照してください。
- 「スキーマ」ドロップダウンに、選択した接続に対応するすべてのスキーマが2つのグループで表示されます:
- 既存のスキーマ(Oracle Data Transformsにインポートしたスキーマ)および
- 新規データベース・スキーマ(まだインポートしていないスキーマ)。
使用するスキーマをドロップダウンから選択します。ノート:
ユーザー名やパスワードが指定されていない、ウォレットが見つからないなど、情報が欠落している場合は、「この接続には、不足している情報があります。」というエラーが表示され、リストの移入に失敗する可能性があります。「編集」アイコン()をクリックすると、接続の更新ページを開いて、欠落している詳細を入力できます。
- 「次」をクリックします。
- 同様に、ターゲット接続を定義します。
- 「保存」をクリックします。
「データ・ロードの詳細」ページが表示され、ロードされたすべてのデータ・エンティティがリストされます。
「プロジェクト」ページからのデータ・ロードの作成
「プロジェクト」ページからデータ・ロードを作成するには、
- ホーム・ページで「プロジェクト」をクリックし、必要なプロジェクト・タイトルをクリックします。左側のペインで、「データ・ロード」をクリックし、「データ・ロードの作成」をクリックします。
「データ・ロードの作成」ウィザードが表示されます。
- 「名前」フィールドに、データ・ロードの名前を入力します。
- 説明を追加します。これはオプションです。
- ソースおよびターゲットのスキーマを選択します。
ノート:
「プロジェクト」ページを使用してデータ・ロードを作成する前に、接続が作成されていることを確認します。接続の詳細は、接続の使用を参照してください。- OCI GoldenGateデプロイメント・コンソールを使用してデータ・エンティティをロードするには:
- 「GoldenGateの使用」チェック・ボックスを選択します。
「データ・ロードの作成」ページに、OCI GoldenGateに固有のフィールドが表示されるようになります。
- ドロップダウンからGoldenGate接続を選択します。
- ソース接続を選択するには、「登録済データベース」および「スキーマ」を選択します。
- 同様に、ターゲット接続を定義します。
- 「GoldenGateの使用」チェック・ボックスを選択します。
- 他のすべての接続タイプを使用してエンティティをロードするには:
- ソース接続を定義するには、「接続」ドロップダウンから、データ・エンティティの追加元となる接続を選択します。
- 「スキーマ」ドロップダウンから、使用するスキーマを選択します。選択した接続に対応するすべてのスキーマが2つのグループで表示されます
- 既存のスキーマ(Oracle Data Transformsにインポートしたスキーマ)および
- 新規データベース・スキーマ(まだインポートしていないスキーマ)。
- OCI GoldenGateデプロイメント・コンソールを使用してデータ・エンティティをロードするには:
- 「作成」をクリックします。
「データ・ロードの詳細」ページが表示され、ロードされたすべてのデータ・エンティティがリストされます。
データ・ロードの実行
データ・ロードを作成すると、データ・ロードの実行に必要な詳細が表示される「データ・ロードの詳細」ページに移動します。
これには、ソース・スキーマの詳細、ソース・スキーマからロードされたデータ・エンティティ、およびターゲット・スキーマの詳細が含まれます。各データ・エンティティに適用するアクション(再作成、切捨て、追加)を選択して、ターゲット・スキーマに表をバルク・ロードできます。データ・ロードを実行すると、リクエストを完了するために複数のジョブがバックグラウンドで実行されます。
データ・ロードは、次のいずれかの方法で実行できます:
ノート:
Oracle Object Storage接続でのデータ・ロードはサポートされていません。「データ・ロードの詳細」ページからのデータ・ロードの実行
「データ・ロードの詳細」ページには、データ・ロードの実行に必要な情報が表示されます。ターゲット・スキーマにロードする前に、データ・エンティティに様々なアクション(増分マージ、増分追加、再作成、切捨て、追加)を適用できます。
ノート:
適用先:
データ・ロードが大規模な場合は、問題を回避するためにODIエージェントのメモリーを増やすことが必要になる場合があります。データ・ロードの実行を開始する前に、ODIエージェントのメモリーの増加の手順に従います。
「データ・ロードの詳細」ページからデータ・ロードを実行するには:
- 「データ・ロードの詳細」ページで、ターゲット・スキーマに移動するデータ・エンティティを選択します。
リストをフィルタするには、次のいずれかを実行します:
- 「名前」テキスト・ボックスに、名前または名前の一部を入力します。この検索では、指定した文字列が名前に含まれるデータ・エンティティが返されます。たとえば、検索文字列ADでは、ADMIN、ADDRESS、BADGE、UPGRADE、WORKLOADなどの結果が返されます。
- パターン一致を使用して特定の文字列を検索するには、正規表現の使用トグルをオンにします。たとえば、検索文字列CO.*では、CONTACT、COUNT、COUNTRYなどの結果が返されます。
複数のデータ・エンティティを選択して、ターゲット・スキーマにロードできます。次のオプションを使用して、表示されるリストをソートすることもできます:- すべて - 検索基準に一致するすべてのデータ・エンティティが表示されます。
- 選択済 - 選択したすべての行が表示されます。
- 未選択 - 選択していないすべての行が表示されます。
- 無効 - すべての無効な行が表示されます。
ノート:
これらのオプションでは、検索基準に基づいてデータ・エンティティのリストが表示されます。すべてのデータ・エンティティのリストを表示するには、適用されているフィルタをすべてクリアします。 - 必要なアイコンをクリックして、次のいずれかのアクションを選択します:
- 増分マージ - 指定したマージ・キーに基づいてソース表をターゲット表と比較することで、選択した列のデータを更新します。このオプションを使用するには、マージする列を選択し、マージ・キーを選択します。「検証」アイコン(
)をクリックして、選択した値を検証します。
- 増分追加 - ターゲット・スキーマの選択した列のデータを更新します。このオプションを使用するには、更新する列を選択し、「検証」アイコン(
)をクリックして選択を検証します。
データ・ロードを初めて実行する場合、このオプションは「追加」、「切捨て」および「再作成」オプションと同様に機能します。つまり、すべての行がターゲットに挿入されます。後続のすべてのデータ・ロード実行で、「増分列」を使用してデータを追加する新しい行のみをフィルタし、同じ行が複数回ロードされないようにします。
ノート:
- 「増分列」の最終更新値は、データ・ロードに格納されます。同じ表を使用して新しいデータ・ロードを作成する場合、このオプションは、初めて実行したときに「追加」、「切捨て」および「再作成」のように機能します。
- ターゲット表が切り捨てられていない場合は、「追加」、「切捨て」および「再作成」モードを使用してデータ・ロードを開始してからアクションを「増分追加」に切り替えないでください。「増分追加」アクションを使用してデータ・ロードを開始することをお薦めします。
- 再作成 – 表がターゲット・スキーマにすでに存在する場合は、既存の表を削除して再作成します。
ノート:
このオプションは、OCI GoldenGateを使用してロードされるデータ・エンティティには使用できません。 - 切捨て – 表がターゲット・スキーマにすでに存在する場合は、選択した表からすべてのデータを削除します。何も削除されません。
ノート:
デルタ共有データ・ロードの場合、「データ・ロードの詳細」ページにはオプションのみが含まれます。ターゲット・スキーマにロードする前に、データ・エンティティに様々なアクション(増分マージ、増分追加、再作成、切捨て、追加)を適用することはできません。これは、デルタ共有サーバーとターゲット・スキーマ間でデータが一貫していることを確認するためです。
- 追加 – データセットのすべての行をターゲットに挿入します。データセットにターゲットにすでに存在するレコードが含まれる場合、重複レコードが存在することになります。ソース・データセットで新しいレコードのみが含まれると想定される場合、またはターゲットに重複行があっても問題にならない場合は、「追加」を使用します。
- ロードしない – データ・ロード・ジョブから、選択したデータ・エンティティをスキップします。「保存」をクリックすると、これらのデータ・エンティティは、今後のデータ・ロード・ジョブで使用できなくなります。
複数のデータ・エンティティを選択して、異なるアクションを適用できます。保存されていない行は太字で強調表示されます。
ノート:
これらのオプションは、デルタ共有接続には使用できません。 - 増分マージ - 指定したマージ・キーに基づいてソース表をターゲット表と比較することで、選択した列のデータを更新します。このオプションを使用するには、マージする列を選択し、マージ・キーを選択します。「検証」アイコン(
- ソース列名をターゲット表に格納する方法を指定するには、「データ・ロードの詳細」ページの右側にある「拡張オプション」をクリックします。次のいずれかを選択します:
- すべての名前をデリミタで囲んで元の名前を保持 - ターゲット表のソース表と同じ名前の列名を作成します。
- デリミタを使用しない - デフォルトで選択されています。すべての列名を大文字に変換し、スペースおよび特殊文字をアンダースコアで置き換えます。
次のオプションは、
Date
、Timestamp
、Start
などの予約語に適用されます。- デリミタで囲む - デフォルトで選択されています。予約語である列名をデリミタで囲みます(すべての列名ではありません)。
- 接頭辞の使用 - (すべての列名ではなく)予約語である列名に、指定された接頭辞を追加します。
変換後に同じ名前を持つ列名の場合、一意性を維持するために、名前には数値の接尾辞が付きます。例: 列名
Date
、date
、DATE
、Item_@Code
、Item$$Code
、Item%%Code
次のようにターゲット表に作成されます。
DATE
、DATE_0
、DATE_1
、ITEM__CODE
、ITEM__CODE_0
、ITEM__CODE_1
。
ノート:
データ・ロードを実行すると、選択したオプションが適用され、後続のすべての実行で保持されます。構成は変更できません。 - 変更を保存する場合は、
をクリックします。行の緑色のチェックマーク(
)は、変更が保存されていることを示します。
- データ・ロードを開始するには、
をクリックします。
- GoldenGateデータ・ロードでは、
をクリックします。
データ・ロードが正常に開始されると、確認プロンプトが表示されます。
データ・ロードのステータスを確認するには、ターゲット・スキーマの詳細のすぐ下にある「ステータス」パネルを参照してください。「ステータス」パネルの詳細は、「データ・ロード、データ・フローおよびワークフローのステータスのモニター」を参照してください。このパネルには、このデータ・ロードを実行するために実行されるジョブへのリンクが表示されます。「ジョブの詳細」ページで進行状況をモニターするには、リンクをクリックします。ジョブの詳細は、「ジョブの作成および管理」を参照してください。
「ワークフローの詳細」ページからのデータ・ロードの実行
データ・フローまたはワークフローとともに複数のデータ・ロードをワークフローに追加し、個別のステップとして実行できます。「ワークフローの詳細」ページの左側のパネルには、使用可能なデータ・フロー、ワークフローおよびデータ・ロードがリストされます。
- データ・ロード - このフォルダには、ローカル・データ変換インスタンスで作成したすべてのデータ・ロードが示されます。ローカル・データ・ロードであるワークフローのステップを選択すると、デザイン・キャンバスの右側にある「プロパティ」パネルで、「タイプ」には
「データ・ロード」
、「リンクされたオブジェクト」には「ホーム ><nameofDataLoad>
」と表示されます。 - リモート・データ・ロード - このフォルダには、リモート・データ変換インスタンスで作成したすべてのデータ・ロードが示されます。リモート・データ・ロード用のデータ変換接続の作成を参照してください。リモート・データ・ロードであるワークフローのステップを選択すると、デザイン・キャンバスの右側にある「プロパティ」パネルで、「タイプ」には
「リモート・データ・ロード」
、「リンクされたオブジェクト」には「データ変換接続の名前
><nameofDataLoad>
」と表示されます。
データ・ロードをワークフローに追加したら、をクリックして実行します。