注意:
- 本教程需要访问 Oracle Cloud。要注册免费账户,请参阅开始使用 Oracle Cloud Infrastructure 免费套餐。
- 它对 Oracle Cloud Infrastructure 身份证明、租户和区间使用示例值。完成实验室后,请使用特定于云环境的那些值替换这些值。
在 Oracle Big Data Service 中创建 HBase 快照备份和还原
简介
HBase 快照支持跨集群高效备份和恢复表。本教程演示如何在源集群中创建快照,将其导出到 Oracle Cloud Infrastructure (OCI) 存储桶,以及在目标集群中还原快照。
目标
-
创建和管理 HBase 快照。
-
使用 OCI 存储桶在集群之间导出和导入快照。
-
还原快照以检索目标群集中的表数据。
先决条件
-
部署和运行 OCI 源和目标 Oracle Big Data Service 集群。
-
已配置用于存储快照的 OCI 存储桶。
-
具有 HBase 命令和操作的基本知识。
任务 1:在源群集中创建表并填充数据
-
使用以下命令创建表并添加一些数据。
hbase> create 'table1', 'cf1' hbase> put 'table1', '1', 'cf1:age', '30' hbase> put 'table1', '2', 'cf1:name', 'John'
-
使用以下命令验证数据是否已正确填充。
hbase> scan 'table1'
任务 2:获取表的快照
-
使用以下命令为表创建快照。
hbase> snapshot 'table1', 'table1-snapshot'
-
使用以下命令列出要确认的快照。
hbase> list_snapshots
任务 3:将快照导出到 OCI 存储桶
-
使用以下命令将快照导出到 OCI 存储桶。
hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot -snapshot table1-snapshot -copy-to oci://<bucket>@<namespace>/<path> -mappers 16
-
使用以下命令验证快照文件是否已复制。
hadoop fs -ls oci://<bucket>@<namespace>/<path>/
任务 4:将快照导入目标集群
-
使用以下命令将快照从 OCI 存储桶复制到目标集群。
hbase org.apache.hadoop.hbase.snapshot.ExportSnapshot -snapshot table1-snapshot -copy-from oci://<bucket>@<namespace>/<path> -copy-to /apps/hbase/data -mappers 16
-
使用以下命令确认快照在目标群集中可用。
hbase> list_snapshots
任务 5:在目标群集中还原快照
-
使用以下命令从快照恢复表。
hbase> restore_snapshot 'table1-snapshot'
-
使用以下命令扫描恢复的表以验证数据。
hbase> scan 'table1'
故障排除和技巧
-
快照一致性:确保在创建快照期间不修改表,以避免不一致。
-
存储路径验证:验证快照导出和导入进程的正确路径。
后续步骤
考虑使用 Oozie 或 cron 作业自动调度定期快照导出到 OCI 存储桶。
相关链接
致谢
- Authors — Pavan Upadhyay(首席云工程师)、Saket Bihari(首席云工程师)
更多学习资源
浏览 docs.oracle.com/learn 上的其他实验室,或者访问 Oracle Learning YouTube 渠道上的更多免费学习内容。此外,请访问 education.oracle.com/learning-explorer 成为 Oracle Learning Explorer。
有关产品文档,请访问 Oracle 帮助中心。
Create HBase Snapshot Backup and Restore in Oracle Big Data Service
G25611-01
January 2025
Copyright ©2025, Oracle and/or its affiliates.