计划您的灾难恢复策略

灾难可能会使关键系统脱机,损坏办公室和数据中心,或使运行业务运营所需的数据库和应用程序暂时不可用。 灾难恢复计划是企业的流程和技术路线图,用于快速备份最重要的系统和应用程序,以便在恢复其他系统的同时恢复工作。

灾难恢复 (Disaster Recovery,DR) 涵盖了企业在发生破坏性事件后使其计算工作负载重新联机的技术计划,以及在灾难发生前测试手册的方法。在灾难恢复计划中,工作负载按重要性顺序排列。旨在尽可能减少计算停机时间和丢失数据,同时平衡每个工作负载的成本。

灾难恢复描述了企业在意外停机后将重要 IT 系统重新联机时所使用的策略、技术和预算。在发生中断之前,确定在灾难发生后必须立即恢复哪些关键任务应用程序,并按重要性组对其他应用程序进行排名。

有两个关键灾难恢复度量:恢复时间目标 (recovery time objective,RTO),用于度量系统可以保持脱机的最长时间;恢复点目标 (recovery point objective,RPO) 用于度量企业可以承受的丢失数据量,并与备份或复制的频率相关联。对于两者而言,较短的阈值更好,但成本更高。IT 组织通常为其运行的每个系统设置 RTO 和 RPO,以便平衡成本和重要性。

制定灾难恢复计划

Cloud Architect,Cloud Operations Manager,安全架构师

全面评估灾难性事件的潜在风险、运营的潜在损害、员工和外部利益相关方可能受到的影响,以及您的灾难恢复计划可能产生的财务损失或监管罚款。

作为制定 DR 计划的一部分,确定执行发起人和受影响的团队;编制灾难期间可能受到伤害的物理和 IT 资产目录;并考虑对客户、供应商、合作伙伴和其他利益相关者的潜在影响。

确定哪些工作负载可以从备份中恢复,哪些工作负载需要实时数据与以较低容量运行的服务相结合,哪些工作负载需要全容量。在某些情况下,停机的活动系统会自动切换到备用系统,从而尽可能减少停机时间并实现零数据丢失。在其他情况下,切换将是手动的。选择备份站点并制定一个计划,使他们能够快速重新启动应用程序。云在这里是一个很大的帮助。查找可能妨碍重新启动操作的 IT 依赖项,例如,一个脱机应用程序阻止另一个脱机应用程序重新联机。

除了这些技术方面之外,高管领导和业务部门还应制定紧急沟通和响应计划,以及为员工提供关于 DR 计划的培训、通过桌面测试或演练测试和排练的规定,并持续改进该计划。

设计灾难恢复解决方案

Cloud Architect,Cloud Operations Manager,安全架构师

在制定灾难恢复计划时,首先对潜在的灾难性事件及其对 IT 系统和业务流程的影响进行风险评估。
然后,IT 和业务部门团队在管理层的支持下,应该根据资产和系统的重要性进行排名,并根据所需的 RTO 和 RPO 以及可用预算,分配 DR 策略来保护每个资产和系统。DR 计划是更广泛的业务连续性计划的一部分,用于将技术错误导致的灾难、网络攻击或中断时间缩短到恢复时间。它们需要不断测试和更新。

为传统灾难恢复或基于云的灾难恢复制定计划。传统 DR 依赖于位于公司拥有的数据中心的冗余服务器和存储设备,或者将业务数据和应用程序实例备份到远程数据中心,因此一个地理区域中的问题不太可能对远处的远程副本造成损害。相比之下,基于云的 DR 策略通过在公有云中存储应用实例的较小或备用副本来节省前期成本,并在需要紧急激活时添加计算资源来扩展这些实例。企业还可以跨多个云区域分发关键任务应用。

实施全栈灾难恢复

Cloud Architect,Cloud Operations Manager,安全架构师

Oracle Cloud Infrastructure Full Stack Disaster Recovery 是一个灾难恢复业务流程和管理服务,可为应用程序堆栈的所有层(包括基础结构、中间件、数据库和应用程序)提供全面的灾难恢复功能。

OCI Full Stack Disaster Recovery (DR) 可确保在各种数据中心停机期间实现全面的业务连续性,确保企业在区域范围内停机或可用性域停机的影响最小。

全栈灾难恢复 (Full Stack DR) 足够灵活,可以轻松与各种 Oracle 平台、非 Oracle 应用和基础设施集成。Full Stack DR 可为在租户中部署的服务和应用生成、运行和监视灾难恢复计划。Full Stack DR 在服务级别运行,因此不会影响租户中运行的其他服务。您可以根据您的特定需求定制由 Full Stack DR 生成的灾难恢复计划。

主动监视 Full Stack DR 操作的进度,并在操作过程中出现错误时采取纠正措施。通过定期运行全栈灾难恢复预检查来验证和监视业务连续性就绪情况和合规性。

OCI 支持 Full Stack DR 到 OCI。在实施全栈灾难恢复之前,任何内部部署工作负载都需要迁移到 OCI。

利用灾难恢复钻取计划,您可以在不中断生产堆栈的情况下执行和验证业务连续性配置和计划。在备用区域中将生产堆栈的副本隔离,以便进行测试和验证。