为虚拟机灾难恢复配置机架软件

机架软件迁移管理器 (RMM) 部署在生产站点中,用于将虚拟机复制到 OCI 和 Compute Cloud@Customer

以下 Rackware 体系结构显示了 OCI 和 Compute Cloud@Customer 之间的灾难恢复。



在此体系结构中,RMM 部署在生产站点中,以将虚拟机复制到 OCI 和 Compute Cloud@Customer 。RMM 服务器部署在 OCI 上。RMM 服务器上配置了 Rackware DR 计划,以保护 Web 和应用程序 VM 及其连接的块存储。Web 和应用 VM 及其块存储由 Rackware 从 OCI 复制到 Compute Cloud@Customer

关于为 OCI 配置备份和恢复体系结构

以下是配置 OCI 备份和恢复体系结构的配置建议:

  • 将 OCI 配置为生产站点或主站点,将 Compute Cloud@Customer 配置为辅助站点或备用站点。
  • 将 Rackware 灾难恢复策略配置为动态预配的目标。机架软件通过在 RMM 上维护原始服务器映像的副本来保护您的工作负载。如果发生事件,可以使用映像按需在目标基础设施上部署实例,从而显著降低成本并降低 RPO,同时降低 RTO 成本。
  • 机架软件会停止虚拟机并将其从 OCI 复制到 Compute Cloud@Customer
  • 配置运行 OCI 的任何生产数据库以复制到 Compute Cloud@Customer 上的备用数据库。如果需要故障转移,您可以使用 Data Guard 提升备用 Oracle Database ,以及失败后返回到 OCI 中的 Oracle Database 在灾难恢复工作完成后返回到主数据库。
  • 在 OCI 中部署 OCI 存储网关,正确配置并安排云同步复制,以便将 OCI 对象存储从 OCI 复制到 Compute Cloud@Customer
  • 在灾难恢复操作期间,使用 Rackware 在 Compute Cloud@Customer 和 OCI 之间编排虚拟机的灾难恢复。

关于为 OCI 配置 Pilot Light 体系结构

试验灯光体系结构与使用 OCI 的 Compute Cloud@Customer 的灾难恢复相同。

以下是配置建议:

  • 与备份和还原用例类似,在生产站点中部署 RMM,以将虚拟机复制到 OCI 和 Compute Cloud@Customer 。在这种情况下,将 OCI 配置为生产站点或主站点,将 Compute Cloud@Customer 配置为辅助站点或备用站点。
  • 将 Rackware 灾难恢复策略配置为预配的目标。使用此配置,除了原始服务器在 RMM 上的映像之外,您还可以选择在目标基础结构上维护活动服务器实例来保护工作负载。配置同步作业以按用户指定的间隔更新映像和目标服务器。此方法可以实现最低 RTO,但成本更高,因为您必须始终维护活动的灾难恢复站点。
  • 机架软件将虚拟机从 OCI 复制到 Compute Cloud@Customer 中以最小规模运行的 Compute Cloud@Customer
  • 配置运行 OCI 的任何生产数据库以复制到 Compute Cloud@Customer 上的备用数据库。如果需要故障转移,您可以使用 Data Guard 提升备用 Oracle Database ,以及失败后返回到 OCI 中的 Oracle Database 在灾难恢复工作完成后返回到主数据库。
  • 在 OCI 中部署 OCI 存储网关,并正确配置了活动云同步复制,以将 OCI 对象存储从 OCI 复制到 Compute Cloud@Customer

关于为 OCI 配置热备用体系结构

Warm Standby 体系结构与使用 OCI 的 Compute Cloud@Customer 的灾难恢复相同。

以下是配置建议:

  • 在生产站点中部署 RMM,以便将虚拟机复制到 OCI 和 Compute Cloud@Customer 。在这种情况下,将 OCI 配置为生产站点或主站点,将 Compute Cloud@Customer 配置为辅助站点或备用站点。
  • 将 Rackware 灾难恢复策略配置为预配的目标。使用此配置,除了原始服务器在 RMM 上的映像之外,您还可以选择在目标基础结构上维护活动服务器实例来保护工作负载。配置同步作业以按用户指定的间隔(具有不同的周期性)更新映像和目标服务器。此方法可以实现最低 RTO,但成本更高,因为您必须始终维护活动的灾难恢复站点。
  • 机架软件会不断复制虚拟机,从 OCI 到 Compute Cloud@Customer ,运行在 Compute Cloud@Customer 中运行的 OCI 生产环境的相同版本。
  • 配置运行 OCI 的任何生产数据库以复制到 Compute Cloud@Customer 上的备用数据库。如果需要故障转移,您可以使用 Data Guard 提升备用 Oracle Database ,以及失败后返回到 OCI 中的 Oracle Database 在灾难恢复工作完成后返回到主数据库。
  • 在 OCI 中部署 OCI 存储网关,并正确配置了主动和连续云同步复制,以将 OCI 对象存储从 OCI 复制到 Compute Cloud@Customer

配置用于从 OCI 到 Oracle Compute Cloud@Customer 的灾难恢复的机架

以下是配置 RackWare 以执行从 OCI 到 Oracle Compute Cloud@Customer for Linux 的灾难恢复的逐步步骤:

对于 Linux 平台,建议使用以下配置

  • 访问身份证明:具有 sudo 权限的 root 用户或用户
  • 存储
    • 源卷组必须至少有 15% 的可用空间作为空闲区。
    • /var/tmp 应至少具有 20 MB 的空闲空间。
  • no-exec/tmp/var/tmp 文件系统不应在 fstab 中配置 no-exec 属性。
  • Grub :源服务器应具有 /etc/default/grub 文件
  • Antivirus :如果有任何防病毒程序在 Origin 上运行,则应将 /mnt/rackware/ 目录添加到 allowlist。

对于 Windows 平台,建议使用以下配置:

  • 访问凭证:具有管理权限的 SYSTEM 用户或本地用户。
  • 存储:每个卷对于 VSS 快照应该具有足够的可用空间(至少/大约 20%)。
  • Antivirus :源应将 rsync.exerwattr.exe rwchangesvc.exerw_tngsync_util.exe 添加到任何防病毒程序或 Windows Defender 的允许列表中。
  • 语言:对于 SYSTEM 语言环境使用英语以外的任何语言,请与 Rackware 支持联系。

请执行以下步骤:

  1. 假定已在 OCI 中正确安装了 Rackware RMM,请转至 Rackware RMM 管理控制台并使用安装期间配置的凭证登录。波次选项可以是以下选项:
  2. 创建波次:要创建波次,请导航到复制波次,然后单击加号 (+) 图标打开波次创建向导。提供名称并单击“创建”。
    • 并行计数:允许用户设置波次内的并行传输数。
    • 自动预配:用户可以通过对目标云的 API 调用配置 RMM 来预配目标。
    • DR 策略:用户可以配置策略以定期同步波次中的所有主机。
    • 传入:启用后,数据通过 RMM 流。(源、RMM、目标)
  3. 配置灾难恢复策略:通过灾难恢复策略,您可以按用户指定的间隔将源的差值同步到在 RackWare RMM 和目标实例(如果是预配方案)上捕获的映像。用户可以根据需要在不同的周期内创建任意数量的灾难恢复策略。这样可以更灵活地根据用户的 DR 策略以不同的间隔同步不同的波次。要创建新的灾难恢复策略,请导航到 "DR","Policies",然后单击加号 (+) 图标打开 DR 创建向导。提供 DR 名称、周期、开始时间和通知电子邮件。
  4. 应用灾难恢复策略:要应用灾难恢复策略,请导航到“复制”选项卡,单击“波次”,单击 OCI 到 C3 波次详细信息,然后单击“无策略”。将打开“配置”对话框。选择正确的灾难恢复策略,然后单击分配策略。下面列出的屏幕截图显示了以前配置到 OCI 的 DRPolicy_01 策略分配给 Oracle Compute Cloud@Customer 波次。将策略分配给波次时,会将该波次从复制、波次移至 DR、波次移至灾难恢复。
  5. 要在 "Wave Detail" 屏幕上初始化 Windows 或 Linux 虚拟机的复制和灾难恢复,请单击 Start Replication

机架软件还提供了以下功能,可用于微调灾难恢复体系结构:

  • 使用自动预配的右侧大小调整:用户可以选择减少或增加目标实例的计算和存储规范。此功能允许用户添加重新调整文件系统大小的粒度。
  • 灾难恢复期间的动态预配:用户可以利用 Rackware 在本地维护源实例的副本映像,并在灾难恢复事件中使用此映像部署故障转移实例。
  • 备份、单个文件恢复和保护快照:Rackware 的备份产品具有丰富的功能集,例如快照保留长达 3 年、选择性文件恢复以及无限制的受保护快照以实现时间点恢复。
  • BIOS 到 UEFI :用户可以无缝迁移到启用了 UEFI 的实例,而无需对原始实例进行任何其他配置更改。
  • 限制迁移:通过能够分别限制带宽,用户可以更好地控制每个迁移。
  • 完全自动化的故障转移和故障恢复:故障转移是完全自动化的,恢复到源环境时也是如此。
  • Rackware Migration Manager :提供更多功能,例如选择性文件系统同步、文件和文件夹排除、启用 cloud-init 和定制后处理脚本。