注意:
- 本教程需要访问 Oracle Cloud。要注册免费账户,请参阅开始使用 Oracle Cloud Infrastructure 免费套餐。
- 它对 Oracle Cloud Infrastructure 身份证明、租户和区间使用示例值。完成实验室后,请使用特定于云环境的那些值替换这些值。
使用 OCI Full Stack Disaster Recovery 增强了灾难恢复计划管理
简介
Oracle Cloud Infrastructure Full Stack Disaster Recovery (OCI Full Stack DR) 只需单击一下即可编排全球 Oracle Cloud Infrastructure (OCI) 区域之间的计算、数据库和应用转换。客户可以自动执行恢复一个或多个业务系统所需的步骤,而无需重新设计或重新设计现有基础设施、数据库或应用,也不需要专门的管理或转换服务器。
OCI Full Stack DR 服务的最新更新显著改善了 DR 计划的管理。现在,如果存在任何成员更新、添加或删除,将保留计划,而不是将其删除,从而允许用户刷新计划并验证它们。让我们来了解一下这些更改如何改善用户体验并简化 DR 管理。
初始部署体系结构
-
2 x 在主区域(vmapp01 和 vmapp02)上移动计算。
-
主区域中包含 vmapp01 和 vmapp02 引导卷的 1 个卷组。
目标部署体系结构
-
1 x 在主区域 (vmapp01) 上移动实例。
-
主区域上的 1 个非移动实例 (vmapp03)。
-
1 个非移动实例,位于备用区域 (vmapp03dr)。
-
主区域中仅包含 vmapp01 的引导卷的 1 个卷组。
目标
修改现有全栈 DR 保护组成员资源而不删除任何现有 DR 计划。本教程将通过删除一个移动计算并在现有主和备用 DR 保护组中添加两个非移动计算来演示计划刷新工作流,这两个主和备用 DR 保护组已在两个 OCI 区域之间对等。
主区域是 Ashburn ,备用区域是 Phoenix 。
本教程将包含以下任务。
- 任务 1:从主 DRPG 中删除成员。
- 任务 2:向主 DRPG 和备用 DRPG 添加新成员。
- 任务 3:在备用 DRPG 中刷新计划。
- 任务 4:验证备用 DRPG 中的计划。
- 任务 5:对备用 DRPG 中的计划进行最终调整。
- 任务 6:在备用 DRPG 中执行切换计划。
- 任务 7:切换后刷新并验证 DR 计划。
先决条件
-
本教程假定 DR 保护组 (DR Protection Groups,DRPG) 已经存在,您在两个区域中都有现有的 DR 计划。
-
本教程假定读者具有管理员权限,并且 OCI Full Stack DR 所需的 Oracle Cloud Infrastructure Identity and Access Management (OCI IAM) 策略已就位。有关更多信息,请参见 Configuring Identity and Access Management (IAM) policy to use Full Stack DR 和 Policies for Full Stack Disaster Recovery 。
-
在本教程中移除的移动计算的引导卷 (appvm02 ) 已从现有卷组 (vgapp01 ) 中移除。如果 appvm02 的引导设备仍包含在 vgapp01 中,则 DR 计划更新将失败。有关更多信息,请参见 Removing Volumes from a Group 。
-
primary 区域中已存在一个新的计算实例,OCI Full Stack DR 能够在来宾操作系统上运行命令。有关详细信息,请参阅在实例上运行命令。
-
备用区域中已存在一个新的计算实例,OCI Full Stack DR 能够在来宾操作系统上运行命令。有关详细信息,请参阅在实例上运行命令。
注:在每个区域中创建的两个计算实例将添加为非移动计算,这意味着引导卷不需要添加到卷组,不需要复制,并且不会添加为任一区域中的 DRPG 成员。
任务 1:从主 DRPG 中删除成员
-
在主 DRPG (
DRPG_Refresh_IAD
) 中,选择成员。 -
选择计算 VM (
vmapp02
),然后单击删除成员。 -
选择我了解必须刷新并验证所有现有计划,然后单击删除。
任务 2:向主 DRPG 和备用 DRPG 添加新成员
-
在主 DRPG (
DRPG_Refresh_IAD
) 中,选择成员并将计算 VM (vmapp03
) 添加为成员。 -
在备用 DRPG (
DRPG_Refresh_PHX
) 中,选择成员并将计算 VM (vmapp03dr
) 添加为成员。
每当对主 DR 保护组或备用 DR 保护组的成员进行更改时,备用 DR 保护组 (DR Protection Group,DRPG) 中的所有 DR 计划都会设置为 Needs attention (Needs refresh) 。无法修改备用区域和主区域中的 DR 计划。可以在任一区域中对 DRPG 成员资格进行其他更改,但在刷新和验证工作流完成之前,无法添加、删除或修改 DR 计划组和步骤。
对保护组中的成员进行任何更改后,您应该会看到如下截图。此屏幕截图显示了应作为最佳做法存在于备用保护组中的四种 DR 规划类型中的三种。您可能已创建或未创建这三种规划类型,这只是一个示例。
任务 3:在备用 DRPG 中刷新 DR 计划
刷新处于 "Needs Attention (Needs Refresh)"(需要刷新)状态的 DR 计划以查看由于对两个区域中的保护组成员所做的更改而将添加或删除的计划组和计划步骤。这是一个关键步骤,允许您在作为任务 4 的一部分提交到计划的更改之前直观地查看 DR 计划。
只能刷新和验证备用 DRPG 中包含的 DR 计划,因为它们处于“需要注意”(需要刷新)状态。主 DRPG 中处于非活动状态的 DR 计划在 DRPG 继承备用角色之前无法刷新。手动切换 DR 保护组详细信息页中的角色对刷新过程不起作用,因此将主 DRPG 角色更改为备用 DRPG 的唯一有效方法是执行备用 DRPG 中的切换计划。切换将在下一个任务中进行说明。
刷新的目的是使人们有机会在提交更改之前查看将在 DR 计划中添加或删除的所有内容。完成计划刷新后,将标记受成员资格更改影响的计划组和步骤。以下列表显示了调用修改后的计划组和步骤的各种标记。
- 已修改组:某些步骤已添加到组或从组中删除。
- 已添加组:已添加新组。
- 已删除组:验证后将删除现有组。
- 添加的步骤:添加了新步骤。
- 已删除步骤:验证后将删除现有步骤。
执行相应步骤:
-
要开始,请选择处于 Needs Attention (Needs Refresh) 状态的 DR 计划。
-
单击刷新,如以下屏幕截图中所示。
-
将弹出一个确认框。单击确认框中的刷新以继续。
刷新完成后,DR 计划将类似于下面的屏幕截图。刷新流程将自测对两个区域中的成员资源所做的所有更改,然后修改计划组和步骤,以显示将根据成员资格更改进行哪些调整。刷新完成后,刷新 DR 计划的状态将更改为 Needs Attention (Needs verify) 。请注意,在屏幕截图中, Refresh 按钮的标签已更改为 Verify 。
按以下屏幕截图所示展开所有计划组将显示作为验证任务的一部分添加或删除的所有单独计划步骤。使用上面的列表中的标记临时标记更新后的计划组和相应的步骤。
刷新并直观查看处于 Needs Attention (Needs refresh) 状态的备用 DRPG 中的所有剩余 DR 计划,然后转到下一个任务。
任务 4:在备用 DRPG 中验证 DR 计划
以可视方式查看刷新后的 DR 计划。这是提交修改的 DR 计划中的计划更改的另一个关键步骤。
-
要开始,请选择处于需要注意(需要验证)状态的任何计划。
-
单击 Verify ,如以下屏幕截图中所示。
-
将弹出一个确认框。单击确认框中的验证以继续。
验证过程会从计划中删除所有修改标记,并启用运行预检查和执行计划按钮,如下面的屏幕截图中所示。验证完成后,计划状态将更改为活动。
验证备用 DRPG 中处于 Needs Attention (Needs verify) 状态的所有剩余 DR 计划,直到所有计划都已更改为 Active ,然后转到下一个任务。
任务 5:对备用 DRPG 中的计划进行最终调整
本教程中显示的 DR 计划示例没有任何用户定义的计划组或步骤。但是,您可能希望尝试添加用户定义的计划组和步骤(如果不存在)。
如果您要使用此教程更新租户中的现有 DR 保护组和计划,请使用此机会对刷新的 DR 计划进行适当的更改。以下列表显示了您可能希望在现有计划中调整的几个示例:
- 如果将全新的资源类型添加为任一区域中的 DR 保护组的成员,则可以添加新组。确保组顺序正确。
- 您可能需要为全新的项目创建新的用户定义计划组和步骤。
- 您可能需要向现有的用户定义计划组添加新步骤。
- 您可能需要对现有计划组重新排序,以改进或修复操作顺序。
在移至下一个任务之前,请确保已调整了所有现有 DR 计划。
任务 6:在备用 DRPG 中执行切换计划
注:
备用区域中的 DR 计划此时应全部处于活动状态,这意味着即使灾难性事件导致主区域出现中断,OCI 全栈 DR 也可以执行活动的故障转移、切换和 DR 钻取计划。切换具有中断性,需要中断。因此,可以在以后某个时间点执行此任务,此时可以安排中断在当前备用区域中执行切换计划。
如果现在无法完成此步骤,请不要忘记在将来的某个时间点完成此任务。
为在当前备用区域中刚刷新的切换计划执行预检查,然后在预检查成功时执行切换计划。之后,在切换成功完成后,对等 DR 保护组中包含的所有 DR 计划的步骤 3 和 4。
主区域中的 DR 计划仍将处于 Inactive (Needs refresh) 状态,并且还需要刷新。但是,无法修改具有主要角色的保护组中包含的恢复计划,包括刷新和验证。您需要将工作负载转换为当前备用区域,以完成完整的 DR 计划刷新生命周期并确保灾难恢复的完整性。
作为最佳实践,首先以独立操作的形式执行预检查。
-
要开始,请在备用区域中打开切换计划。
-
单击运行预检查。
-
将弹出一个确认框。单击确认框中的运行预检查以继续。
确保预检查成功完成,如下面的屏幕截图中所示。此时可能需要修复任何失败的预检查步骤,然后再次运行预检查,直到所有步骤都成功。
执行切换计划。
-
要开始,请单击执行计划。
-
将弹出一个确认框。单击确认框中的执行计划以继续。
-
监视计划执行以确保计划中的所有步骤都成功。
以下屏幕截图显示了切换计划的成功完成。但是,即使预检查成功完成,您也可能会遇到失败的步骤;随着恢复步骤的实际执行,可能会出现失败的步骤。补救任何失败的步骤,然后重试。
任务 7:切换后刷新并验证 DR 计划
切换完成后,DR 保护组的角色将自动撤消。继续我们的例子,凤凰城现在将扮演主要角色,阿什本将扮演备用角色。
此时,阿什本的所有 DR 计划现在都处于 Inactive (Needs refresh) 状态,因为它现在是备用 DRPG。您需要在新的备用区域中重复以下任务:
- 任务 3:在备用 DRPG 中刷新计划。
- 任务 4:验证备用 DRPG 中的计划。
- 任务 5:对备用 DRPG 中的计划进行最终调整。
后续步骤
有两种最佳实践应纳入正常的日常运营,以帮助确保 DR 计划的就绪性。
- 定期定期执行预检查。
- 定期定期执行 DR 钻取。
请考虑安排备用 DR 保护组中所有 DR 计划的每周预检查。预检查可以随时运行,对生产工作负载没有影响。这将有助于确保 DR 计划的完整性、捕获缺少的成员资源、缺少的网络、无法找到由用户定义的步骤调用的预期脚本等。
验证灾难恢复就绪状态的另一个非常重要的方法是每月或每季度安排一次定期 DR 钻取。DR Drills 还对生产工作负载没有影响,但您只需单击一下按钮,即可验证备用区域中计算、存储、Oracle 数据库和负载平衡器的后端集的恢复。了解有关全栈 DR 钻取的更多信息。
相关链接
-
加入 #full-stack-dr 闲置通道
确认
- 作者 -Raphael Teixeira(全栈 DR 工程技术人员的主要成员)
更多学习资源
浏览 docs.oracle.com/learn 上的其他实验室,或者访问 Oracle Learning YouTube 渠道上的更多免费学习内容。此外,请访问 education.oracle.com/learning-explorer 成为 Oracle Learning Explorer。
有关产品文档,请访问 Oracle 帮助中心。
Enhanced Disaster Recovery Plan Management with OCI Full Stack Disaster Recovery
G23609-01
December 2024