注意:
- 本教程需要访问 Oracle Cloud。要注册免费账户,请参阅开始使用 Oracle Cloud Infrastructure 免费套餐。
- 它对 Oracle Cloud Infrastructure 身份证明、租户和区间使用示例值。完成实验室后,请使用特定于云环境的那些值替换这些值。
从 Oracle Big Data Service 集群访问跨区域 Oracle Cloud Infrastructure 存储桶
简介
在本教程中,我们将指导您完成从 Oracle Big Data Service 集群访问跨区域 Oracle Cloud Infrastructure (OCI) 存储桶的过程。OCI 中的跨区域存储桶访问支持 Oracle Big Data Service 集群与位于不同区域的存储桶无缝交互。此功能对于具有多区域架构的组织至关重要,可以实现高效的数据共享、备份和管理。
目标
-
在 Oracle Big Data Service 集群中启用跨区域存储桶访问。
-
配置和测试跨区域存储桶设置。
-
解决流程中的常见问题。
先决条件
-
部署并运行 Oracle Big Data Service 集群。
-
要访问的跨区域 Oracle Cloud Infrastructure 存储桶。
-
访问 Oracle Big Data Service 节点和 Apache Ambari。
任务 1:在 Oracle Big Data Service 中启用跨区域存储桶访问
-
转到 Apache Ambari 控制台,导航到服务、 HDFS 、 CONFIGS 并单击 ADVANCED 。
-
在定制核心站点部分中,为 HDFS 定制核心站点配置添加以下属性。
fs.oci.client.multiregion.enabled=true
-
保存配置并在 Apache Ambari 中重新启动任何必要的服务。
任务 2:测试跨区域存储桶访问
-
通过 SSH 连接到 Oracle Big Data Service 集群的任何节点。
-
使用以下 HDFS 命令测试对跨区域存储桶的访问。
hdfs dfs -ls oci://<bucket name>@<namespace>.<region-code>/
分别将
<bucket name>
、<namespace>
和<region-code>
替换为存储桶名称、名称空间和目标区域的代码。例如,us-phoenix-1
。
故障排除和技巧
-
验证 core-site.xml:如果存储桶内容不可访问,请确保使用
fs.oci.client.multiregion.enabled=true
属性正确更新了core-site.xml
文件。 -
Ambari Restart(Ambari 重新启动):在进行配置更改后,在 Apache Ambari 中重新启动所有相关服务。
后续步骤
考虑使用 Apache Hadoop 分布式副本 (DistCp) 等工具自动执行跨区域同步,以实现备份或灾难恢复。
相关链接
致谢
- Authors — Pavan Upadhyay(首席云工程师)、Saket Bihari(首席云工程师)
更多学习资源
浏览 docs.oracle.com/learn 上的其他实验室,或者访问 Oracle Learning YouTube 渠道上的更多免费学习内容。此外,请访问 education.oracle.com/learning-explorer 成为 Oracle Learning Explorer。
有关产品文档,请访问 Oracle 帮助中心。
Access Cross-Region Oracle Cloud Infrastructure Buckets from Oracle Big Data Service Cluster
G25408-01
January 2025