将数据从 Autonomous AI Transaction Processing 复制到 Apache Iceberg
了解如何在 OCI GoldenGate 中将数据从 Autonomous AI Transaction Processing 复制到 Apache Iceberg。
开始之前
要成功完成此快速入门,您必须具有:
-
源自治 AI 事务处理
-
目标 Apache Iceberg 环境:
-
OCI GoldenGate 支持 Azure Data Lake Storage、Amazon S3 和 Google Cloud Storage 作为 Apache Iceberg 表的存储服务。
-
OCI GoldenGate 支持适用于 Apache Iceberg 的 Hadoop、Nessie、AWS Glue、Polaris、REST 和 JDBC 目录。
-
环境设置:自治 AI 事务处理
如果您尚未为复制设置源数据库,则可以按照以下步骤加载要用于此快速入门的示例方案。此快速入门将自治 AI 事务处理用于源数据库。
要设置源 Autonomous AI Transaction Processing,请执行以下操作:
-
下载并解压缩示例数据库方案。
-
在 Oracle Cloud 控制台中,从“Autonomous AI Database(自治 AI 数据库)”页面中选择您的自治 AI 事务处理 (ATP) 实例,以查看其详细信息并访问 Database Actions。
-
解锁 GGADMIN 用户:
-
选择数据库操作,然后选择数据库用户。
-
找到 GGADMIN,然后选择其省略号菜单(三个点),然后选择编辑。
-
在 "Edit User"(编辑用户)面板中,输入 GGADMIN 密码,确认密码,然后取消选择 Account is Locked 。
-
选择 Apply Changes(应用更改)。
-
-
加载源示例方案和数据:
-
从“数据库操作”菜单的“开发”下,选择 SQL 。
-
将脚本从
OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql复制并粘贴到 SQL 工作表中。 -
选择运行脚本。“Script Output(脚本输出)”选项卡显示确认消息。
-
清除 SQL 工作表,然后从
OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.复制并粘贴 SQL 脚本提示:您可能需要单独运行每个语句,SQL 工具才能成功执行脚本。
-
要验证表是否已成功创建,请关闭 SQL 窗口,然后重新打开它。在“Navigator(导航器)”选项卡中,查找
SRC_OCIGGLL方案,然后从其各自的下拉列表中选择表。
-
-
启用补充事件记录:
-
清除 SQL 工作表。
-
输入以下语句,然后选择运行语句:
ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;
-
任务 1:创建资源
此快速入门示例需要源和目标的部署和连接。
-
为源自治 AI 事务处理实例创建 Oracle 部署。
-
为 Apache Iceberg 目标创建大数据部署。
任务 2:添加提取
-
在“Deployments(部署)”页面上,选择源 Autonomous AI Transaction Processing 部署。
-
在部署详细信息页上,选择启动控制台。
-
使用源部署的管理员用户名和密码登录。
-
添加提取。
任务 3:添加并运行分发路径
-
如果使用 GoldenGate 身份证明存储,请在目标大数据部署中为分发路径创建用户,否则跳至步骤 3。
-
在 source GoldenGate 部署控制台中,为在步骤 1 中创建的用户添加路径连接。
-
在源 GoldenGate 部署控制台中,在左侧导航中选择 Path Connections(路径连接)。
-
选择添加路径连接(加号图标),然后完成以下操作:
-
对于身份证明别名,输入
GGSNetwork。 -
对于用户 ID ,输入在步骤 1 中创建的用户的名称。
-
输入用户的密码两次以进行验证。
-
-
选择提交。
路径连接将显示在“路径连接”列表中。
-
-
在 source 部署控制台中, add a Distribution Path with the following values:
-
在源选项页上:
-
对于源提取,选择在任务 2 中创建的提取。
-
对于线索名称,输入两个字符的名称,例如
E1。
-
-
在目标选项页上:
-
对于目标主机,输入目标部署的主机域。
-
在端口号中,输入
443。 -
对于线索名称,输入两个字符的名称,例如
E1。 -
对于别名,输入在步骤 2 中创建的身份证明别名。
-
-
-
在 target 大数据部署控制台中,查看作为分发路径结果创建的接收器路径。
-
在目标大数据部署控制台中,选择接收方服务。
-
查看路径详细信息。此路径是在上一步中创建的分发路径的结果创建的。
-
任务 4:添加并运行复制
要添加和运行复制,请执行以下操作:
-
在目标大数据部署控制台导航菜单中,依次选择复制和添加复制(加号图标)。
-
在“添加复制”面板的复制信息页上,根据需要填写字段,然后选择下一步:
-
对于复制类型,选择“经典复制”
-
输入 Process Name(流程名称),长度不超过 5 个字符。
-
输入说明,以帮助区分此流程与其它流程。
-
-
在复制选项页上,根据需要填写字段,然后选择下一步:
-
对于 Replicat Trail ,输入提取线索名称。
-
对于目标,选择 Apache Iceberg 。
-
对于格式,选择要摄取到 Apache Iceberg 的格式。默认值为“Parquet”。
-
对于 Available Alias(可用别名),从下拉列表中选择 Apache Iceberg 连接。
-
-
在“托管选项”页上,保留默认设置并选择下一步。
-
在“复制参数”页上,保留默认设置,然后选择下一步。
-
在“复制属性”页上,更新标记的字段 TODO ,然后选择创建并运行。
有关详细信息,请参阅 Apache Iceberg 目标详细信息。
任务 5:验证复制
要验证复制,请对源 ATP 实例执行更新。
-
在 Oracle Cloud 控制台中,打开导航菜单,选择 Oracle AI Database ,然后选择 Autonomous AI Transaction Processing 。
-
在自治 AI 事务处理实例列表中,选择源实例以查看其详细信息。
-
在“数据库详细信息”页上,选择数据库操作。
注:您应该自动登录。如果没有,则使用数据库身份证明登录。
-
在“数据库操作”主页上,选择 SQL 。
-
在工作表中输入以下内容,然后选择运行脚本。
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002); -
在源 ATP 部署控制台中,选择提取名称,然后选择统计信息。验证 SRC_OCIGGLL.SRC_CITY 是否具有 10 个插入。
-
在目标 Big Data OCI GoldenGate 部署控制台中,选择复制名称,然后选择统计信息。验证 SRC_OCIGGLL.SRC_CITY 是否具有 10 个插入。
-
在 Oracle Cloud 控制台中,导航到 Oracle 对象存储桶并检查其内容。