将数据从 Autonomous AI Transaction Processing 复制到 Microsoft Fabric Lakehouse
此快速入门演示如何使用 OCI GoldenGate 将数据从 Autonomous AI Transaction Processing 复制到 Microsoft Fabric Lakehouse。
开始之前
要成功完成此快速入门,您必须具有以下各项:
-
源自治 AI 事务处理实例。
-
Microsoft Fabric Lakehouse 工作区:
-
创建 Microsoft Entra ID 应用程序注册。记下应用程序(客户端)ID、目录(租户)ID 和客户端密钥。
-
转到 Fabric your Workspace,选择 Manage Access 并选择 Add People or Group(添加人员或组)。键入注册的应用程序名称,选择内容提供者角色,然后选择添加。
-
在工作区中创建数据湖仓。
-
环境设置:自治 AI 事务处理
如果您尚未为复制设置源数据库,则可以按照以下步骤加载要用于此快速入门的示例方案。此快速入门将自治 AI 事务处理用于源数据库。
要设置源 Autonomous AI Transaction Processing,请执行以下操作:
-
下载并解压缩示例数据库方案。
-
在 Oracle Cloud 控制台中,从“Autonomous AI Database(自治 AI 数据库)”页面中选择您的自治 AI 事务处理 (ATP) 实例,以查看其详细信息并访问 Database Actions。
-
解锁 GGADMIN 用户:
-
选择数据库操作,然后选择数据库用户。
-
找到 GGADMIN,然后选择其省略号菜单(三个点),然后选择编辑。
-
在 "Edit User"(编辑用户)面板中,输入 GGADMIN 密码,确认密码,然后取消选择 Account is Locked 。
-
选择 Apply Changes(应用更改)。
-
-
加载源示例方案和数据:
-
从“数据库操作”菜单的“开发”下,选择 SQL 。
-
将脚本从
OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql复制并粘贴到 SQL 工作表中。 -
选择运行脚本。“Script Output(脚本输出)”选项卡显示确认消息。
-
清除 SQL 工作表,然后从
OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.复制并粘贴 SQL 脚本提示:您可能需要单独运行每个语句,SQL 工具才能成功执行脚本。
-
要验证表是否已成功创建,请关闭 SQL 窗口,然后重新打开它。在“Navigator(导航器)”选项卡中,查找
SRC_OCIGGLL方案,然后从其各自的下拉列表中选择表。
-
-
启用补充事件记录:
-
清除 SQL 工作表。
-
输入以下语句,然后选择运行语句:
ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;
-
任务 1:创建 OCI GoldenGate 资源
此快速入门示例需要源和目标的部署和连接。
-
为源自治 AI 事务处理实例创建 Oracle 部署。
-
为目标 Microsoft Fabric Lakehouse 创建大数据部署。
任务 2:添加提取
-
在“Deployments(部署)”页面上,选择源 Autonomous AI Transaction Processing 部署。
-
在部署详细信息页上,选择启动控制台。
-
使用源部署的管理员用户名和密码登录。
-
添加提取。
任务 3:添加并运行分发路径
-
如果使用 GoldenGate 身份证明存储,请在目标大数据部署中为分发路径创建用户,否则跳至步骤 3。
-
在 source GoldenGate 部署控制台中,为在步骤 1 中创建的用户添加路径连接。
-
在源 GoldenGate 部署控制台中,在左侧导航中选择 Path Connections(路径连接)。
-
选择添加路径连接(加号图标),然后完成以下操作:
-
对于身份证明别名,输入
GGSNetwork。 -
对于用户 ID ,输入在步骤 1 中创建的用户的名称。
-
输入用户的密码两次以进行验证。
-
-
选择提交。
路径连接将显示在“路径连接”列表中。
-
-
在 source 部署控制台中, add a Distribution Path with the following values:
-
在源选项页上:
-
对于源提取,选择在任务 2 中创建的提取。
-
对于线索名称,输入两个字符的名称,例如
E1。
-
-
在目标选项页上:
-
对于目标主机,输入目标部署的主机域。
-
在端口号中,输入
443。 -
对于线索名称,输入两个字符的名称,例如
E1。 -
对于别名,输入在步骤 2 中创建的身份证明别名。
-
-
-
在 target 大数据部署控制台中,查看作为分发路径结果创建的接收器路径。
-
在目标大数据部署控制台中,选择接收方服务。
-
查看路径详细信息。此路径是在上一步中创建的分发路径的结果创建的。
-
任务 4:添加并运行复制
-
在目标大数据部署控制台中,选择 Administrator Service ,然后选择 Add Replicat (加号图标)。
-
Add a Replicat ,包含以下值:
-
在“复制信息”页的“复制”类型下,选择经典复制,输入进程名称,然后选择下一步。
-
在“复制选项”页上:
-
对于名称,输入任务 2 中的线索名称。
-
对于 Target(目标),选择 Microsoft Fabric Lakehouse。
-
对于 Format(格式),选择要摄取到 Microsoft Fabric Lakehouse 的格式。
-
对于 Available Alias(可用别名),从下拉列表中选择 Microsoft Fabric Lakehouse 连接。
-
-
在“托管选项”页面上,保留默认值。
-
在“复制参数”页上,保留默认值。
-
在 "Replicat Properties"(复制属性)页面上,更新以下属性:
-
gg.eventhandler.onelake.workspace=<target_workspace_name> -
gg.eventhandler.onelake.lakehouse=<target_lakehouse_name>
-
-
-
选择创建并运行。
返回到 "Overview"(概述)页面,您可以在该页面中查看复制详细信息。
任务 5:验证复制
对源 Autonomous AI Transaction Processing 实例执行一些更新以验证复制到 Microsoft Fabric Lakehouse。
-
在 Oracle Cloud 控制台中,打开导航菜单,选择 Oracle AI Database ,然后选择 Autonomous AI Transaction Processing 。
-
在自治 AI 事务处理实例列表中,选择源实例以查看其详细信息。
-
在“数据库详细信息”页上,选择数据库操作。
注:您应该自动登录。如果没有,则使用数据库身份证明登录。
-
在“数据库操作”主页上,选择 SQL 。
-
在工作表中输入以下内容,然后选择运行脚本。
Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581); Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002); -
在源 ATP 部署控制台中,选择提取名称,然后选择统计信息。验证 SRC_OCIGGLL.SRC_CITY 是否具有 10 个插入。
-
在目标 Big Data OCI GoldenGate 部署控制台中,选择复制名称,然后选择统计信息。验证 SRC_OCIGGLL.SRC_CITY 是否具有 10 个插入。
-
在 Oracle Cloud 控制台中,导航到 Oracle 对象存储桶并检查其内容。