規劃運算執行處理的高可用性

Oracle Cloud Infrastructure Compute 提供裸機和虛擬機器 (VM) 執行處理,可讓您從具有單一核心的小型 VM,部署任何所需的大小伺服器,到具有許多核心及較大 RAM 的大型 VM 或裸機伺服器。這些選項可確保在雲端執行要求最嚴苛的應用系統與工作負載的效能、彈性及控管能力。

為規劃運算執行處理的高可用性,您應該考慮的主要設計策略包括:
  • 妥善運用容錯域和可用性網域,消除單點故障。
  • 使用監控、執行處理集區和負載平衡器。
  • 確保您的設計可保護運算執行處理的資料可用性和完整性。
本文將說明這些策略。

跨錯誤網域分配執行處理

設計高可用性解決方案的主要原則之一就是避免發生單點失效。然後,金鑰設計原則會將您的執行處理分散到多個容錯域。

在單一可用性網域部署中,您可以適當地運用容錯域來提升在 Oracle Cloud Infrastructure 上執行應用程式的可用性。應用程式的架構決定您是使用容錯域來區分執行處理或分組執行處理。
  • 狀況 1:高可用性應用程式架構

    在這個案例中,您有一個高可用性應用程式,例如,兩部 Web 伺服器和叢集化資料庫。在此,您將一個 Web 伺服器與一個資料庫節點群組在一個容錯域,另一組容錯域中的另一半組。此架構可確保任何一個容錯域的故障不會導致應用程式中斷。

  • 狀況 2:單一 Web 伺服器和資料庫執行處理架構

    在此情況下,您的應用程式架構無法高可用性,例如,您有一個 Web 伺服器和一個資料庫執行處理。Web 伺服器和資料庫執行處理都必須放置在相同的容錯域中。此架構可確保您的應用程式只受到該單一容錯域失敗的影響。

跨可用性網域分配執行處理

另一種高可用性方式是部署在多個可用性網域中執行相同作業的運算執行處理。此設計透過在資料中心導入備援功能,移除單一故障點。

在多重可用性網域部署中,您可以依可用性網域區分執行處理群組。這可保護您的應用系統免於資料中心層次的失敗,例如停電、實體基礎架構失敗或計畫性維護事件。

當執行處理分散到各個可用性網域或容錯域時,經常會使用負載平衡器來改善資源使用狀況、促進擴展,以及確保高可用性。它支援將內送要求遞送至各種後端集或運算執行處理群組,平衡這些後端之間的網路流量。

下圖說明建置在兩個可用性網域中的 Web 伺服器 VM,以實作備援和負載平衡器:



注意:

此架構顯示多個可用性網域 (AD)。針對具有單一 AD 的區域,請調整架構以將資源分散到 AD 中的容錯域。
您可以根據系統或應用程式需求,在待命或作用中模式中實行此架構備援:
  • 在待命模式中,主要元件失敗時,待命元件會接管。待命模式通常用於需要維護其狀態的應用程式。
  • 在作用中模式中,未將任何元件指定為主要或待命;所有元件都會主動參與執行相同的作業。當其中一個元件失敗時,相關任務只會分配給另一個元件。作用中模式通常用於無狀態應用程式。

確保資料的高可用性和完整性

對於高可用性架構,請務必確保您的設計可保護運算執行處理的資料可用性和完整性。為了保護運算執行處理的資料可用性,您可以將資料複寫或備份到另一個位置。

  • 區塊磁碟區摘要

    Oracle Cloud Infrastructure Block Volume 服務可讓您動態佈建及管理區塊儲存體磁碟區。您可以建立、附加、連接和移動磁碟區,並視需要變更磁碟區效能,以符合儲存、效能和應用程式需求。將磁碟區連附和連線到執行處理之後,您便可以像使用一般硬碟一樣使用該磁碟區。您也可以中斷磁碟區連線,然後將其連附到另一個執行處理,而不會遺失資料。

  • 磁碟區持久性

    與標準連附的磁碟機相比,Oracle Cloud Infrastructure Block Volume 服務提供高層次的資料持久性。系統會自動為您複製所有磁碟區,協助防止資料遺失。具備內建修復機制的多個儲存伺服器會以冗餘方式儲存多個資料複本。針對服務層次目標,區塊磁碟區服務是專為區塊磁碟區和開機磁碟區而設計,年度持久性可達 99.99%。不過,建議您定期備份,以防止可用性網域發生失敗。

  • 磁碟區複寫

    區塊磁碟區服務可讓您對同一區域內的其他區域或可用性網域,執行區塊磁碟區和開機磁碟區的持續自動非同步複寫。相同區域內的跨可用性網域複寫僅支援具有多個可用性網域的區域。若要判斷哪些區域包含多個可用性網域,請參閱表格中的「可用性網域」欄位,列出「關於區域」和「可用性網域」中的區域。此功能支援災害復原、移轉以及業務擴充案例,而不需要磁碟區備份。如需詳細資訊,請參閱 "Replicating a Volume",您可以從本播放手冊中其他地方的「瀏覽更多」主題存取。

關於區塊磁碟區備份

Oracle Cloud Infrastructure Block Volume 服務的備份功能可讓您建立區塊磁碟區上資料的時間點快照。您可以對磁碟區連附至執行處理時或取消連附時進行備份。在備份之後或稍後您選擇的時間內,即可立即將這些備份回復到新的磁碟區。

備份會經過加密並儲存在 OCI Object Storage 中,可以還原為新磁碟區,以回復至儲存相同區域內的任何可用性網域。此功能為您提供磁碟區的備用複本,並可讓您在同一個區域內順利完成災害復原。

您可以透過兩種方式來起始備份:手動啟動備份,或指派定義設定備份排程的原則。如需 bloack 磁碟區的更多資訊,請參閱您可以從本手冊其他地方的「瀏覽更多」主題存取的 Block Volume Backups 概述。https://docs.oracle.com/en-us/iaas/Content/Block/Concepts/blockvolumebackups.htm

使用同步或非同步複寫

如果運算執行處理失敗,您可以使用同步或非同步複寫來保護資料:

  • 區域中的可用性網域是透過支援同步複寫的高效能網路互連。如果您的應用程式需要立即容錯移轉,且無法容忍資料遺失,請採用同步複寫。由於網路效能需求的緣故,同步複製通常會在一個區域內使用。
  • 針對需要跨區域保護資料可用性的應用系統,採用非同步複寫。

傳統備份是保護資料的另一種方式。為了得到最高的資料持久性,請勿將備份儲存在與原始運算執行處理相同的可用性網域中。您應該使用 Oracle Cloud Infrastructure Object Storage 來備份運算執行處理的資料。對於具有本機 NVMe 磁碟機的運算執行處理,受保護的 RAID 陣列是防止 NVMe 裝置故障的最佳方式。

如需詳細資訊,請參閱 "Protecting Data on NVMe Devices",您可以從本手冊其他地方的「瀏覽更多」主題存取此裝置。