Autonomous Transaction ProcessingからApache Icebergへのデータをレプリケートします

OCI GoldenGateで、Autonomous Transaction ProcessingからApache Icebergにデータをレプリケートする方法をご覧ください。

開始する前に

このクイックスタートが正常に完了するには、次が必要です:

  • ソースAutonomous Transaction Processing
  • ターゲットのApache Iceberg環境:
    • OCI GoldenGateは、Apache Iceberg表のストレージ・サービスとして、Azure Data Lake Storage、Amazon S3およびGoogle Cloud Storageをサポートしています。
    • OCI GoldenGateは、Apache IcebergのHadoop、Nessie、AWS Glue、Polaris、RESTおよびJDBC Catalogsをサポートしています。

環境設定: Autonomous Transaction Processing

レプリケーション用のソース・データベースがまだ設定されていない場合は、次のステップに従って、このクイックスタートに使用するサンプル・スキーマをロードできます。このクイックスタートでは、ソース・データベースにAutonomous Transaction Processingを使用します。

ソースAutonomous Databaseを設定するには:

  1. サンプル・データベース・スキーマをダウンロードして解凍します。
  2. Oracle Cloudコンソールで、「Autonomous Databases」ページからAutonomous Transaction Processing (ATP)インスタンスを選択して、その詳細を表示し、データベース・アクションにアクセスします。
  3. GGADMINユーザーのロックを解除します。
    1. 「データベース・アクション」をクリックし、「データベース・ユーザー」をクリックします。
    2. GGADMINを見つけて、その省略記号メニュー(3つのドット)をクリックし、「編集」を選択します。
    3. 「ユーザーの編集」パネルで、GGADMINパスワードを入力し、パスワードを確認して、「アカウントがロックされています」の選択を解除します。
    4. 「変更の適用」をクリックします。
  4. ソース・サンプル・スキーマおよびデータをロードしてください。
    1. 「データベース・アクション」メニューの「開発」で、「SQL」を選択します。
    2. OCIGGLL_OCIGGS_SETUP_USERS_ATP.sqlからスクリプトをコピーしてSQLワークシートに貼り付けます。
    3. 「スクリプトの実行」をクリックします。「スクリプト出力」タブに確認メッセージが表示されます。
    4. SQLワークシートをクリアして、OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.からSQLスクリプトをコピーして貼り付けます。

      ヒント:

      SQLツールでスクリプトを正常に実行するには、各文を個別に実行する必要がある場合があります。
    5. 表が正常に作成されたことを確認するには、SQLウィンドウを閉じて再度開きます。「ナビゲータ」タブで、SRC_OCIGGLLスキーマを検索し、それぞれのドロップダウンから表を選択します。
  5. サプリメンタル・ロギングを有効にします:
    1. SQLワークシートをクリアします。
    2. 次の文を入力し、「文の実行」をクリックします:
      ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;

タスク2: Extractの追加

  1. 「デプロイメント」ページで、ソースAutonomous Transaction Processingデプロイメントを選択します。
  2. 「デプロイメントの詳細」ページで、「コンソールの起動」をクリックします。
  3. ソース・デプロイメントの管理者のユーザー名とパスワードでログインします。
  4. トランザクション情報を追加します
  5. Extractを追加します

タスク3: Distribution Pathの追加および実行

  1. GoldenGate資格証明ストアを使用している場合は、ターゲット・ビッグ・データ・デプロイメントで分散パスのユーザーを作成します。それ以外の場合は、ステップ3に進みます。
  2. ソースATP GoldenGateデプロイメント・コンソールで、ステップ1で作成したユーザーのパス接続を追加します。
    1. ソースATP GoldenGateデプロイメント・コンソールで、左側のナビゲーションの「パス接続」をクリックします。
    2. 「パス接続の追加」(プラス・アイコン)をクリックし、次を完了します:
      1. 「資格証明別名」に、GGSNetworkと入力します。
      2. 「ユーザーID」に、ステップ1で作成したユーザーの名前を入力します、
      3. 確認のためにユーザーのパスワードを2回入力します。
    3. 「送信」をクリックします。

      「パス接続」リストにパス接続が表示されます。

  3. ソースATPデプロイメント・コンソールで、次の値を使用して分散パスを追加します:
    1. 「ソース・オプション」ページで:
      • 「ソースExtract」で、タスク2で作成したExtractを選択します。
      • 「トレイル名」に、2文字の名前(E1など)を入力します。
    2. 「ターゲット・オプション」ページで:
      • 「ターゲット・ホスト」に、ターゲット・デプロイメントのホスト・ドメインを入力します。
      • 「ポート番号」に、443と入力します。
      • 「トレイル名」に、2文字の名前(E1など)を入力します。
      • 「別名」に、ステップ2で作成した資格証明別名を入力します。
  4. ターゲット・ビッグ・データ・デプロイメント・コンソールで、Distribution Pathの結果として作成されたReceiver Pathを確認します。
    1. ターゲット・ビッグ・データ・デプロイメント・コンソールで、Receiver Serviceをクリックします。
    2. パスの詳細を確認します。このパスは、前のステップで作成したDistribution Pathの結果として作成されました。

タスク4: Replicatの追加および実行

Replicatを追加して実行する手順は、次のとおりです。
  1. OCI GoldenGateデプロイメント・コンソールの管理サービスの「ホーム」ページで、「Replicatの追加」(プラス・アイコン)をクリックします。
  2. 「Replicatの追加」パネルの「Replicat情報」ページで、必要に応じてフィールドに入力し、「次」をクリックします:
    • 「Replicatタイプ」で、「クラシックReplicat」を選択します
    • 「プロセス名」を5文字以下で入力します。
    • 「説明」を入力します。これは、このプロセスを他のプロセスと区別するために役立ちます。
  3. 「Replicatオプション」ページで、必要に応じてフィールドに値を入力し、「次」をクリックします:
    1. 「Replicat証跡」に、Extract証跡名を入力します。
    2. 「ターゲット」で、「Apache Iceberg」を選択します。
    3. 「フォーマット」で、Apache Icebergに収集するフォーマットを選択します。デフォルトはParquetです。
    4. 「使用可能な別名」で、ドロップダウンからApache Iceberg接続を選択します。
  4. 「管理対象オプション」ページで、デフォルト設定のままにして「次へ」をクリックします。
  5. 「Replicatパラメータ」ページで、デフォルト設定のままにし、「次」をクリックします。
  6. Replicatプロパティ・ページで、TODOとマークされたフィールドを更新し、「作成して実行」をクリックします。
    詳細は、Apache Icebergターゲットの詳細を参照してください。

タスク5: レプリケーションの確認

レプリケーションを検証するには、ソースATPインスタンスに対する更新を実行します。
  1. Oracle Cloudコンソールで、ナビゲーション・メニューを開き、「Oracle Database」を選択し、次に「Autonomous Database」を選択します。
  2. Autonomous Databasesのリストから、ソース・インスタンスを選択してその詳細を表示します。
  3. データベース詳細ページで、「データベース・アクション」をクリックします。
  4. データベース・アクション・ページで、「SQL」を選択します。
  5. SQLワークシートに次の挿入文を入力し、「スクリプトの実行」をクリックします:
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002);
  6. ソースATPデプロイメント・コンソールで、Extract名を選択し、「統計」をクリックします。SRC_OCIGGLL.SRC_CITYに10個の挿入があることを確認します。
  7. ターゲット・ビッグ・データ・デプロイメント・コンソールで、Replicat名を選択し、「統計」をクリックします。SRC_OCIGGLL.SRC_CITYに10個の挿入があることを確認します。