關於災害復原

災害可以是任何讓您的應用系統承受風險的事件,從網路中斷到設備故障,到自然災害都會發生。封存的災害復原 (DR) 計畫可讓您快速從災害復原,並持續為使用者提供服務。

Oracle Cloud Infrastructure 提供高可用性、安全且可擴展的基礎架構和服務,讓您能夠快速、可靠且安全地復原雲端工作負載。

DR 概念

規劃 DR 的第一個步驟包括判斷復原時間目標 (RTO) 和復原點目標 (RPO)。

RTO 是在發生災害後,必須還原指定應用程式的目標時間。一般而言,應用程式越重要,RTO 就應該越低。

RPO 是災難發生後的一段期間,在災難開始影響企業之前,應用程式可容許遺失資料。

若要建立可確保災害後復原應用程式的計畫且符合成本效益的計畫,您必須將目標復原時間和資料遺失的允差都納入考量。

災害案例

DR 規劃需要徹底瞭解可能會造成災害的所有可能方案。

  • 應用程式失敗

    應用程式在基礎基礎架構中失敗的網路失敗,或是與軟體或硬體組態變更相關的問題。請務必在您的 DR 解決方案設計中加入監督功能,以便偵測到應用程式失敗並傳送警示。視您的需求而定,災害復原解決方案的範圍從單純備份應用程式資料和組態到完全主動 - 主動 - 主動容錯移轉設定,能夠順暢地降低許多類型的失敗。

  • 網路故障

    針對災害復原,請考慮雲端環境中的潛在網路中斷。例如,如果您使用 IPSec VPN 連線將企業內部部署資料中心連線到 Oracle Cloud,IPSec VPN 連線可能會發生網路效能或停機問題。建議您設定多個 IPSec VPN 連線,或同時使用 FastConnect 和 IPSec VPN 連線,以便讓您的網路連線擁有足夠的備援。

  • 資料中心失敗

    未預期的事件可能會影響整個資料中心 (可用性網域)。在 DR 解決方案設計中,規劃這類失敗。如果您的區域有多個可用性網域,建議您在可用性網域之間部署應用系統,以因應特定資料中心的潛在問題。如果您的區域只有一個可用性網域,請考慮使用多個容錯域與多個區域組態的組合,如同區域故障建議中所定義。

  • 區域失敗

    天然災害可能導致整個 Oracle Cloud Infrastructure 區域停止服務。此案例可能是 DR 設計中最嚴重的案例之一。為防止發生此情況,請在多個 Oracle Cloud Infrastructure 區域之間部署您的工作負載。視您的 DR 目標 (RTO 和 RPO) 而定,您可以備份資料或複寫到其他區域,或是在另一個區域中設定完全主動的待命狀態。

變更日誌

此日誌列出重大變更: