將資料從 Autonomous Transaction Processing 複寫至 Apache Iceberg

探索如何在 OCI GoldenGate 中將資料從 Autonomous Transaction Processing 複製到 Apache Iceberg

開始之前

若要順利完成此快速啟動,您必須具備:

  • 來源 Autonomous Transaction Processing
  • 目標 Apache Iceberg 環境:
    • OCI GoldenGate 支援 Azure 資料湖儲存Amazon S3Google Cloud 儲存體,作為 Apache Iceberg 表格的儲存服務。
    • OCI GoldenGate 支援 Apache Iceberg 的 Hadoop、Nessie、AWS Glue、Polaris、REST 和 JDBC 目錄。

環境設定:Autonomous Transaction Processing

如果您尚未設定複製的來源資料庫,您可以依照下列步驟來載入要用於此快速啟動的範例綱要。此快速啟動使用 Autonomous Transaction Processing 作為來源資料庫。

若要設定來源 Autonomous Database,請執行下列動作:

  1. 下載並解壓縮範例資料庫綱要
  2. 在 Oracle Cloud 主控台中,從「自治式資料庫」頁面選取您的 Autonomous Transaction Processing (ATP) 執行處理,以檢視其詳細資訊並存取「資料庫動作」。
  3. 解除鎖定 GGADMIN 使用者:
    1. 按一下「資料庫動作」,然後按一下「資料庫使用者」。
    2. 尋找 GGADMIN,然後按一下其省略符號功能表 (三個點),然後選取編輯
    3. 在「編輯使用者」面板中,輸入 GGADMIN 密碼,確認密碼,然後取消選取帳戶已鎖定
    4. 按一下套用變更
  4. 載入來源範例綱要和資料:
    1. 從「資料庫」動作功能表的「開發」底下,選取 SQL
    2. 將命令檔從 OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql 複製並貼到 SQL 工作表中。
    3. 按一下執行指令碼。「命令檔輸出」頁籤會顯示確認訊息。
    4. 清除 SQL 工作表,然後從 OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql. 複製並貼上 SQL 命令檔

      秘訣:

      您可能需要個別執行每個陳述式,SQL 工具才能順利執行命令檔。
    5. 如果要確認表格已順利建立,請關閉 SQL 視窗再重新開啟。在「導覽器」頁籤中,尋找 SRC_OCIGGLL 綱要,然後從表格的個別下拉式清單中選取表格。
  5. 啟用補充記錄日誌:
    1. 清除 SQL 工作表。
    2. 輸入下列敘述句,然後按一下執行敘述句
      ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;

任務 1:建立資源

此快速啟動範例需要來源和目標的部署和連線。

  1. 建立 Oracle 部署來源 Autonomous Transaction Processing 執行處理。
  2. 建立大數據部署 Apache Iceberg 目標。
  3. 建立 Autonomous Transaction Processing 連線
  4. 建立 Apache Iceberg 連線
  5. 建立 GoldenGate 伺服器連線將它指派給 Oracle 部署
  6. 指派 ATP 連線至 Oracle 部署
  7. 指派 Iceberg 連線至大數據部署

任務 2:新增 Extract

  1. 在「部署」頁面上,選取來源 Autonomous Transaction Processing 部署。
  2. 在部署詳細資訊頁面上,按一下啟動主控台
  3. 以來源部署的管理員使用者名稱和密碼登入。
  4. 新增交易資訊
  5. 新增 Extract

工作 3:新增並執行 Distribution Path

  1. 如果使用 GoldenGate 證明資料存放區,請在目標大數據部署中建立分送路徑的使用者,否則請跳至步驟 3。
  2. 來源 ATP GoldenGate 建置主控台中,為在步驟 1 中建立的使用者新增「路徑連線」。
    1. 在來源 ATP GoldenGate 部署主控台中,按一下左側導覽中的路徑連線
    2. 按一下新增路徑連線 (加號圖示),然後完成下列作業:
      1. 證明資料別名中,輸入 GGSNetwork
      2. 使用者 ID 中,輸入在步驟 1 中建立的使用者名稱。
      3. 輸入使用者的密碼兩次以進行驗證。
    3. 按一下提交

      路徑連線會顯示在「路徑連線」清單中。

  3. 在「來源 ATP 建置主控台」中,使用下列值新增分配路徑
    1. 來源選項頁面上:
      • 對於來源擷取,請選取在任務 2 中建立的擷取。
      • 歷程檔名稱中,輸入兩個字元的名稱,例如 E1
    2. 目標選項頁面上:
      • 目標主機中,輸入目標部署的主機網域。
      • 連接埠號碼中,輸入 443
      • 歷程檔名稱中,輸入兩個字元的名稱,例如 E1
      • 別名中,輸入在步驟 2 中建立的「證明資料別名」。
  4. 在「目標大數據」建置主控台中,複查因 Distribution Path 而建立的 Receiver Path
    1. 在目標 Big Data 部署主控台中,按一下 Receiver Service
    2. 複查路徑詳細資訊。此路徑是由上一個步驟中建立的 Distribution Path 所建立。

作業 4:新增並執行 Replicat

若要新增並執行 Replicat,請執行下列動作:
  1. OCI GoldenGate 部署主控台管理服務首頁中,按一下新增 Replicat (加號圖示)。
  2. 在「新增 Replicat 」面板的「Replicat 資訊」頁面上,視需要完成欄位,然後按一下「下一步」:
    • 針對 Replicat 類型,選取傳統 Replicat
    • 輸入長度不超過 5 個字元的程序名稱
    • 輸入描述,以協助區分此處理與其他處理。
  3. 在「Replicat 選項」頁上,視需要完成欄位,然後按「下一步」:
    1. 在「 Replicat Trail 」中,輸入 Extract 歷程檔名稱。
    2. 目標中,選取 Apache Iceberg
    3. 對於格式,請選取您要擷取至 Apache Iceberg 的格式。預設值為 Parquet。
    4. 可用的別名中,從下拉式清單中選取 Apache Iceberg 連線。
  4. 在「受管理選項」頁面上,保留預設設定,然後按下一步
  5. 在「Replicat 參數」頁面上,保留預設設定,然後按下一步
  6. 在「Replicat 特性」頁面上,更新標示為 TODO 的欄位,然後按一下建立並執行
    如需詳細資訊,請參閱 Apache Iceberg 目標詳細資訊

工作 5:驗證複製

若要驗證複製,請執行來源可承諾量執行環境的更新。
  1. 在 Oracle Cloud 主控台中,開啟導覽功能表,選取 Oracle Database ,然後選取 Autonomous Database
  2. 在自治式資料庫清單中,選取您的來源執行處理以檢視其詳細資訊。
  3. 在「資料庫詳細資訊」頁面上,按一下資料庫動作
  4. 在「資料庫動作 (Database Actions)」頁面上,選取 SQL
  5. 在 SQL 工作表中輸入下列插入陳述式,然後按一下執行指令碼
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002);
  6. 在來源 ATP 部署主控台中,選取「擷取」名稱,然後按一下統計資料。確認 SRC_OCIGGLL.SRC_CITY 有 10 個插入。
  7. 在目標 Big Data 部署主控台中,選取 Replicat 名稱,然後按一下統計資料 (Statistics) 。確認 SRC_OCIGGLL.SRC_CITY 有 10 個插入。