瞭解如何使用 Oracle Cloud VMware Solution 跨 OCI 區域部署 VMware vSAN 延展叢集

Oracle Cloud Infrastructure (OCI) 在其所有多個可用性網域區域中提供高可用性和容錯能力。這些區域本質上提供資料中心層次的錯誤隔離,每個可用性網域都會細分為多個容錯域,以防止機架層次的中斷。此內建架構可滿足大多數企業工作負載的彈性需求。

對於 VMware 工作負載,Oracle Cloud VMware Solution 支援在具有三個可用性網域的區域中,進行多個可用性網域部署。在此情況下,您可以利用 VMware HA 和 VMware vSAN,在單一區域內原生部署 VMware vSAN 延伸叢集,而不需要複雜的跨網站組態。

不過,在僅具有單一可用性網域的 OCI 公用區域中,或在 Oracle Cloud Infrastructure Dedicated Region ( OCI Dedicated Region ,之前稱為 Oracle Dedicated Region Cloud@Customer) 中,無法使用多個可用性網域組態。對於在這些環境中需要區域層級保護以防止完整網站中斷的客戶,必須採用不同的方法。本解決方案手冊提供經過驗證的客戶管理架構,可跨多個 OCI 區域部署 VMWare vSAN 延伸叢集,此解決方案由 Oracle Cloud VMware Solution 提供的完整堆疊控制所提供。

附註:

此部署模型已在 OCI 專用區域中成功測試。如果滿足必要的延遲、主機資源配置和網路連線需求,也可以在 OCI 公用區域中複製該資源配置。

雖然 OCI 不提供部署跨區域 VMware vSAN 延伸叢集的原生或自動化方法,但 Oracle Cloud VMware Solution 則可透過其獨特的彈性來實現。客戶可以保留對 VMware vCenter、VMware NSX 和 VMware ESXi 主機的完整管理控制權,讓他們能夠設計和實作在受限的受管理雲端 VMware 方案中難以或不可能的進階組態。

本解決方案手冊提供使用 Oracle Cloud VMware Solution 建立此強大組態的架構指導與詳細步驟。

瞭解核心概念

什麼是 VMware vSAN 延伸叢集?

vSAN 延伸叢集是 VMware 配置,可將單一邏輯 VMware vSAN 資料存放區延伸到兩個實體獨立的位置。這兩個位置都被視為作用中網站,而當一個網站無法使用時,組態可確保持續可用性。由於 VMware 的原生功能 vSphere HA,而 vSAN 可確保單一網站和目擊者節點維持運作,因此虛擬機器 (VM) 可在網站之間自動容錯移轉。

在 OCI 的相關資訊環境中,此架構與 OCI Dedicated Region 相對應,該區域通常靠近足以符合 VMware vSAN 延展部署的嚴格低延遲需求。

如需更多背景資訊,請參閱 Broadcom 的官方文件: vSAN 延伸叢集簡介

將 vSAN 延伸的叢集延伸至 OCI 和 Oracle Cloud VMware Solution

雖然 VMware vSAN 延伸的叢集通常跨兩個實體獨立的網站,但在 OCI 內,Oracle Cloud VMware Solution 預設可在單一可用性網域中部署 VMware 軟體定義資料中心 (SDDC),或在相同區域內的多個可用性網域中部署。此部署模型符合基礎虛擬雲端網路 (VCN) 的區域範圍,可在 OCI 區域內 (而非跨 OCI 區域) 運作。

為了實現區域層級的復原能力並防止區域中斷,使用 OCI Dedicated Region 的客戶可以在不同的 OCI Dedicated Region 中部署兩個獨立的 Oracle Cloud VMware Solution SDDC。這些 SDDC 會透過 OCI 的專用骨幹網路相互連線,以實現安全、低延遲的通訊。必要的 VMware vSAN Witness 節點部署在鄰近地理區域的第三個區域 (例如 OCI 公用區域),以完成延展的叢集組態。

此設計可實現 VMware 環境中的主動 - 主動站台可用性,確保即使發生區域故障也能持續運作。它同時符合 VMware 和 Oracle 的高可用性和災害復原最佳實務。

架構

此架構顯示如何在多個 OCI 區域部署自訂的 VMware vSAN 延伸叢集。

高階拓樸包括:

  • 主要網站:部署在 OCI Dedicated Region A 的 Oracle Cloud VMware Solution SDDC。
  • 次要網站:部署於 OCI Dedicated Region B 的 Oracle Cloud VMware Solution SDDC。
  • 目擊者網站:用於部署 VMware vSAN Witness Appliance 的區域性位置。

這些網站的通訊是透過 OCI 的專用骨幹和 OCI FastConnect 建立,兩者都必須滿足穩定 VMware vSAN 延伸叢集的低延遲和高頻寬需求。

附註:

此組態不支援 IPSec VPN。

下圖說明此架構。



ocvs-vsan- 延伸叢集 -oracle.zip

下列各節概述影響成功在 Oracle Cloud VMware Solution 中跨 OCI Dedicated Region 部署 VMware vSAN 延伸叢集的主要技術考量。

網路考量

此架構的關鍵驅動因素是強大的 OCI 骨幹網路,可相互連線客戶租用戶內的 OCI 專用區域。此骨幹可確保 VMware vSAN 複製流量與網站之間的活動訊號信號所需的高速、低延遲通訊。

計劃的主要因素:

  • 使用動態路由閘道 (DRG) OCI 專用區域 A 和 OCI 專用區域 B 的 VCN 之間建立遠端對等互連連線 (RPC) 。這樣便可以在所有 VMware ESXi 主機之間進行完整的網格連線。
  • 使用 OCI FastConnect (非 IPSec VPN) 將 OCI Dedicated Region 連線至代管 Witness 的公用 OCI 區域。這可確保一致的低延遲和可靠的輸送量,以支援證人溝通。
  • 參考文件:遠端對等互連管理 DRGOCI FastConnect

運算與儲存考量

這三個區域的基礎架構規劃涉及多個決策:

  1. 區域選擇
    • 請選擇兩個 OCI 專用區域,其間延遲低於 5 毫秒 RTT
    • 選取對 OCI Dedicated Region 進行 Witness 部署時,在短短 200 毫秒 RTT 的公用 OCI 區域。
  2. 選擇資源配置
    • 密集裸機資源配置 (例如 BM.DenseIO.E5.128) 與 VMware vSAN 的本機 NVMe 儲存搭配使用。
    • 請避免使用區塊磁碟區的標準資源配置,因為它們不適合延伸的 vSAN 部署。
  3. 最低主機需求
    • 主要區域:至少三個密集裸機主機
    • 次要區域:至少三個密集裸機主機
    • 目擊者區域:一個裸機主機
  4. 目擊者設備準則

延伸叢集需求

  • 主要區域與次要區域之間的 RTT 延遲小於 5 毫秒
  • 站台與目擊者節點之間的 RTT 延遲小於 200 毫秒
  • 所有主機 (包括 Witness) 都必須屬於相同的 VMware vSAN 叢集
  • 跨區域的主機硬體和組態必須相同
  • 目擊者必須位於三分之一的個別位置

營運考量

客戶需負責手動完成第 2 天作業。主要注意事項:

  • Oracle Cloud VMware Solution 環境會個別部署於每個 OCI Dedicated Region 。次要網站的 VMware vCenter 和 VMware NSX Manager 必須手動分離並與主要叢集整合。
  • 發生網站失敗時,必須手動進行容錯移轉和路由更新。
  • VMware NSX Tier-0 Gateway 僅在單一站台中為使用中,代表用於北南流量路由的主動 - 被動模型。

設計概要

本節以涵蓋 Oracle Cloud VMware Solution 延伸 vSAN 組態架構與需求的先前小節為基礎,說明如何導入高可用性設計,以瞭解 OCI Dedicated Region 失敗。

此設計使用每個站點的兩個 VCN ,導致總計四個 VCN

OCI 專用區域 A

  • VCN Primary 具有兩個 CIDR 區塊;例如,10.16.0.0/16 作為主要 CIDR,172.45.0.0/16 作為次要 CIDR (在建立 VCN 之後新增)。只有在初始 SDDC 部署時才需要次要 CIDR。

    由於 Oracle Cloud VMware Solution SDDC 無法跨多個 VCN,因此次要 CIDR 區塊 (172.45.0.0/16) 會附加至 OCI 專用區域 A 內的主要 VCN。這可讓管理和服務的子網路使用 VLAN 定義,同時將它們以邏輯方式群組在單一 VCN 內。

  • VCN MGMT Active ,使用與附加至「VCN 主要」的次要 CIDR 相同的 CIDR 區塊,亦即 172.45.0.0/16

OCI 專用區域 B

  • VCN Secondary 的 CIDR 區塊與 VCN Primary 不同且不重疊;例如 10.17.0.0/16
  • VCN MGMT Failover ,使用與 VCN MGMT Active 相同的 CIDR 區塊,亦即 172.45.0.0/16

Oracle Cloud VMware Solution 提供網路佈建的彈性。建立 SDDC 時,使用者可以:

  • 指定 CIDR 區塊,並允許 Oracle Cloud VMware Solution 自動化建立必要的網路元件,或
  • 事先手動建立 VCN、子網路、VLAN、路由表和 NSG,然後在部署期間選取這些現有資源。

對此拉伸的 vSAN 設計而言,需要後者方法。精確控制跨多個 VCN 和區域的網路分段需要預先建立路由表、NSG 和 VLAN。此分離支援 VCN 之間的明確責任,並實現無縫的容錯移轉行為。

重要的層面是,管理子網路 (172.45.0.0/16) 必須同時在 OCI 專用區域中存取。為了支援容錯移轉,此設計可讓此 VCN MGMT 網路在容錯移轉事件期間透過手動網路更新,在兩個網站之間進行「浮動」,例如修改路由表並透過 DRG 連附項重新轉換子網路。

DNS 解析對於容錯移轉和服務可用性至關重要。因此,將會在每個 VCN 中建立專用服務子網路來代管 DNS 和支援基礎架構。

對於 VLAN 標記的簡單性:

  • 100 範圍中的 VLAN 標記為區域特定,受其個別網站約束。
  • 200 範圍中的 VLAN 標記與 172.45.0.0/16 子網路相關聯,且會在網站之間浮動

在定義高階設計之後,我們現在從「主要」區域開始,逐步執行每個網站的實際組態設定。