关于灾难恢复

灾难是指将您的应用置于风险级别的任何事件，从网络中断到设备故障，再到自然灾害。利用精心设计的灾难恢复 (Disaster Recovery，DR) 计划，您可以快速从灾难中恢复并继续为用户提供服务。

Oracle Cloud Infrastructure 提供高度可用、安全且可扩展的基础设施和服务，使您可以快速、可靠、安全地恢复云负载。

DR 概念

规划 DR 的第一步涉及确定恢复时间目标 (Recovery Time Object，RTO) 和恢复点目标 (Recovery Point Object，RPO)。

RTO 是发生灾难后必须恢复给定应用程序的目标时间。通常，应用程序越重要，RTO 越低。

RPO 是灾难发生后的期间，应用程序可以在灾难开始影响业务之前容忍丢失的数据。

要制定一个计划来保证灾难后应用程序恢复且经济高效，您必须同时考虑目标恢复时间以及数据丢失的容差。

灾难情形

规划灾难恢复需要全面了解可能导致灾难的所有可能情况。

应用程序故障
应用程序可能会失败底层基础结构中的故障或与软件或硬件配置更改相关的问题的网络故障。在 DR 解决方案设计中包括监视功能非常重要，这样才能检测应用故障并发送预警。DR 解决方案的范围从简单地备份应用数据和配置到完全主动到主动的故障转移设置，从而无缝缓解许多类型的故障，具体取决于您的需求。
网络故障
对于 DR，请考虑云环境中的潜在网络中断。例如，如果您使用 IPSec VPN 连接将内部部署数据中心连接到 Oracle Cloud，则 IPSec VPN 连接可能会遇到网络性能或停机问题。我们建议设置多个 IPSec VPN 连接，或者同时使用 FastConnect 和 IPSec VPN 连接，以便为您的网络连接提供足够的冗余。
数据中心故障
意外事件可能会影响整个数据中心（可用性域）。在 DR 解决方案设计中，规划此类故障。如果您的区域具有多个可用性域，我们建议您在可用性域之间部署应用，以解决特定数据中心可能出现的问题。如果您的区域只有一个可用性域，请考虑将多个容错域和多区域配置（如区域故障建议中所定义）组合在一起。
区域失败
自然灾害可能导致整个 Oracle Cloud Infrastructure 区域停止服务。此方案可能是 DR 设计中最严重的案例之一。为了避免此情况，请在多个 Oracle Cloud Infrastructure 区域中部署您的工作负载。根据您的 DR 目标（RTO 和 RPO），您可以备份数据或者将数据复制到其他区域，或者在其他区域中设置完全主动到主动的备用数据库。

更改日志

此日志列出重大更改：

2022 年 7 月 13 日

添加了在 PaaS（平台即服务）上运行的定制应用以及关于 Oracle Maximum Availability Architecture (MAA)。
刷新并增强了 DR 功能中的内容、确定部署策略、选择 DR 方法并为数据库规划 DR。