Informazioni sulla distribuzione di un cluster esteso vSAN VMware in tutte le aree OCI con Oracle Cloud VMware Solution

Oracle Cloud Infrastructure (OCI) offre alta disponibilità e tolleranza agli errori in tutte le sue molteplici region del dominio di disponibilità. Queste aree forniscono intrinsecamente l'isolamento degli errori a livello di data center, con ogni dominio di disponibilità suddiviso in più domini di errore per proteggersi dalle interruzioni a livello di rack. Questa architettura integrata soddisfa i requisiti di resilienza della maggior parte dei carichi di lavoro aziendali.

Per i carichi di lavoro VMware, Oracle Cloud VMware Solution supporta più distribuzioni di domini di disponibilità in aree con tre domini di disponibilità. In questo caso, puoi distribuire in maniera nativa cluster VMware vSAN estesi all'interno di un'unica area, utilizzando HA VMware e vSAN VMware senza la necessità di complesse configurazioni tra siti.

Tuttavia, nelle aree pubbliche OCI con un solo dominio di disponibilità o in Oracle Cloud Infrastructure Dedicated Region (OCI Dedicated Region, precedentemente noto come Oracle Dedicated Region Cloud@Customer), non sono disponibili più configurazioni del dominio di disponibilità. Per i clienti di questi ambienti che richiedono una protezione a livello di area contro le interruzioni complete del sito, è necessario un approccio diverso. Questo playbook della soluzione presenta un'architettura convalidata e gestita dal cliente per la distribuzione di cluster VMWare vSAN in più region OCI, una soluzione abilitata dal controllo full-stack offerto da Oracle Cloud VMware Solution.

Nota

Questo modello di distribuzione è stato testato con successo nelle OCI Dedicated Region. Se vengono soddisfatti i requisiti necessari di latenza, forma host e connettività di rete, è possibile replicarli anche nelle aree pubbliche OCI.

Sebbene OCI non offra un metodo nativo o automatizzato per la distribuzione di un cluster esteso vSAN VMware tra più aree, Oracle Cloud VMware Solution lo rende possibile attraverso la sua flessibilità unica. I clienti mantengono il pieno controllo amministrativo sugli host VMware vCenter, VMware NSX e VMware ESXi, consentendo loro di progettare e implementare configurazioni avanzate che altrimenti sarebbero difficili o impossibili nelle offerte VMware cloud gestite più limitate.

Questa guida sulla soluzione fornisce indicazioni sull'architettura e passaggi dettagliati per creare questa potente configurazione utilizzando Oracle Cloud VMware Solution.

Comprendere i concetti di base

Che cos'è un cluster esteso vSAN VMware?

Un cluster esteso vSAN è una configurazione VMware che estende un singolo datastore vSAN logico VMware in due posizioni separate fisicamente. Entrambe le ubicazioni sono considerate siti attivi-attivi e la configurazione garantisce una disponibilità continua nel caso in cui un sito non sia disponibile. Le macchine virtuali (VM) possono eseguire automaticamente il failover tra i siti, grazie alle funzionalità native di VMware vSphere HA, e vSAN garantirà la disponibilità dello storage fino a quando un sito e il nodo di testimonianza rimangono operativi.

Nel contesto di OCI, questa architettura si adatta bene alle OCI Dedicated Region, che in genere sono abbastanza vicine geograficamente per soddisfare i rigorosi requisiti di bassa latenza delle implementazioni estese vSAN VMware.

Per ulteriori informazioni, consultare la documentazione ufficiale di Broadcom: Introduzione a vSAN Stretched Clusters.

Estensione di cluster estesi vSAN a OCI e Oracle Cloud VMware Solution

Sebbene i cluster estesi vSAN VMware si estendano in genere su due siti fisicamente separati, all'interno di OCI, Oracle Cloud VMware Solution può distribuire un SDDC (Software-Defined Data Center) VMware in un singolo dominio di disponibilità per impostazione predefinita o in più domini di disponibilità all'interno della stessa area se configurato di conseguenza. Questo modello di distribuzione si allinea all'ambito regionale della rete cloud virtuale (VCN) di base, che opera all'interno, ma non in tutte le region OCI.

Per ottenere resilienza a livello di area e proteggersi dalle interruzioni regionali, i clienti che utilizzano OCI Dedicated Region possono distribuire due SDDC Oracle Cloud VMware Solution separati in OCI Dedicated Region distinte. Questi SDDC sono interconnessi tramite la rete backbone privata di OCI, consentendo una comunicazione sicura e a bassa latenza. Il nodo vSAN Witness VMware richiesto viene distribuito in una terza area geografica vicina (ad esempio un'area pubblica OCI) per completare la configurazione cluster estesa.

Questo design consente la disponibilità attiva-attiva del sito all'interno dell'ambiente VMware e garantisce operazioni continue anche in caso di guasto regionale. Si allinea alle best practice di VMware e Oracle per l'alta disponibilità e il disaster recovery.

Architettura

Questa architettura mostra come distribuire cluster estesi vSAN VMware personalizzati in più aree OCI.

La topologia di alto livello è costituita da:

  • Sito principale: Oracle Cloud VMware Solution SDDC distribuito in OCI Dedicated Region A.
  • Sito secondario: Oracle Cloud VMware Solution SDDC distribuito in OCI Dedicated Region B.
  • Sito testimone: posizione separata a livello regionale per la distribuzione di VMware vSAN Witness Appliance.

La comunicazione tra questi siti viene stabilita attraverso il backbone privato di OCI e OCI FastConnect, entrambi obbligatori per soddisfare i requisiti di bassa latenza e larghezza di banda elevata di un cluster esteso vSAN VMware stabile.

Nota

IPSec VPN non è supportato per questa configurazione.

Il seguente diagramma descrive l'architettura.



ocvs-vsan-stretched-cluster-oracle.zip

Le sezioni seguenti illustrano le principali considerazioni tecniche che influenzano la distribuzione di successo di un cluster esteso vSAN VMware in Oracle Cloud VMware Solution nelle OCI Dedicated Region.

Considerazioni sul networking

Un fattore chiave di questa architettura è la solida rete backbone OCI che interconnette le OCI Dedicated Region all'interno di una tenancy del cliente. Questo backbone garantisce la comunicazione ad alta velocità e a bassa latenza necessaria per il traffico di replica vSAN VMware e la segnalazione heartbeat tra i siti.

Fattori chiave per pianificare:

  • Stabilire connessioni peering remoto (RPC) tra le reti VCN in OCI Dedicated Region A e OCI Dedicated Region B utilizzando i Dynamic Routing Gateway (DRG). Ciò consente la connettività mesh completa in tutti gli host VMware ESXi.
  • Utilizza OCI FastConnect (non IPSec VPN) per connettere entrambe le OCI Dedicated Region all'area OCI pubblica che ospita Witness. Ciò garantisce una bassa latenza coerente e un throughput affidabile per supportare la comunicazione dei testimoni.
  • Documentazione di riferimento: Peering remoto, Managing DRGs, OCI FastConnect

Considerazioni sulla computazione e lo storage

La pianificazione dell'infrastruttura in tutte e tre le regioni prevede diverse decisioni:

  1. Selezione area
    • Scegliere due OCI Dedicated Region con latenza < 5 ms RTT tra di esse.
    • Selezionare un'area OCI pubblica con latenza < 200 ms RTT per entrambe le OCI Dedicated Region per la distribuzione Witness.
  2. Selezione forma
    • Utilizzare le forme Dense Bare Metal (ad esempio BM.DenseIO.E5.128) con storage NVMe locale per VMware vSAN.
    • Evitare le forme standard che utilizzano volumi a blocchi, in quanto non sono adatte per le distribuzioni vSAN estese.
  3. Requisiti minimi dell'host
    • Area primaria: minimo tre host Bare Metal densi
    • Area secondaria: minimo tre host Bare Metal densi
    • Area testimone: un host Bare Metal
  4. Linee guida appliance testimoni

Requisiti cluster estesi

  • Latenza RTT < 5 ms tra regioni primarie e secondarie
  • Latenza RTT < 200 ms tra entrambi i siti e il nodo Witness
  • Tutti gli host (incluso Witness) devono appartenere allo stesso cluster vSAN VMware
  • L'hardware e la configurazione dell'host devono essere identici tra le aree
  • Il testimone deve risiedere in un terzo luogo separato

Considerazioni operative

I clienti sono responsabili del completamento manuale delle operazioni del giorno 2. Note chiave:

  • Gli ambienti Oracle Cloud VMware Solution vengono distribuiti separatamente in ogni OCI Dedicated Region. NSX Manager del sito secondario VMware vCenter e VMware deve essere scollegato e integrato manualmente con il cluster primario.
  • Gli aggiornamenti manuali di failover e instradamento sono necessari in caso di errore del sito.
  • VMware NSX Tier-0 Gateway è attivo solo in un sito, il che implica un modello attivo-passivo per il routing del traffico Nord-Sud.

Panoramica progettazione

Basandosi sulle sezioni precedenti che coprivano l'architettura e i requisiti per una configurazione vSAN estesa con Oracle Cloud VMware Solution, questa sezione spiega come implementare un design ad alta disponibilità in grado di resistere al fallimento di un'OCI Dedicated Region.

Questa progettazione utilizza due reti VCN per sito, con un totale di quattro reti VCN:

OCI Dedicated Region A

  • VCN Primary con due blocchi CIDR, ad esempio 10.16.0.0/16 come CIDR primario e 172.45.0.0/16 come CIDR secondario (aggiunto dopo la creazione della VCN). Il CIDR secondario è necessario solo per la distribuzione dell'SDDC iniziale.

    Poiché un SDDC Oracle Cloud VMware Solution non può estendersi su più VCN, un blocco CIDR secondario (172.45.0.0/16) è collegato alla VCN primaria all'interno di OCI Dedicated Region A. Ciò consente le definizioni VLAN per le subnet di gestione e servizi, mantenendole raggruppate logicamente all'interno di una singola VCN.

  • VCN MGMT Active, utilizzando lo stesso blocco CIDR del CIDR secondario collegato alla rete VCN primaria, ad esempio 172.45.0.0/16.

OCI Dedicated Region B

  • VCN Secondary con un blocco CIDR diverso da e non sovrapposto a VCN Primary; ad esempio, 10.17.0.0/16.
  • VCN MGMT Failover, utilizzando lo stesso blocco CIDR di VCN MGMT Active, ovvero 172.45.0.0/16.

Oracle Cloud VMware Solution offre flessibilità nel provisioning della rete. Durante la creazione dell'SDDC, gli utenti possono effettuare una delle operazioni riportate di seguito.

  • Specificare un blocco CIDR e consentire all'automazione di Oracle Cloud VMware Solution di creare i componenti di rete necessari oppure
  • Creare manualmente VCN, subnet, VLAN, tabelle di instradamento e NSG in anticipo, quindi selezionare queste risorse esistenti durante la distribuzione.

Per questo disegno vSAN allungato, quest'ultimo approccio è necessario. Un controllo preciso sulla segmentazione della rete in più VCN e aree richiede la pre-creazione di tabelle di instradamento, NSG e VLAN. Questa separazione supporta responsabilità chiare tra VCN e consente un comportamento di failover senza interruzioni.

Un aspetto fondamentale è che la subnet di gestione (172.45.0.0/16) deve essere accessibile in entrambe le OCI Dedicated Region. Per supportare il failover, la progettazione consente a questa rete MGMT VCN di "fluttare" tra i due siti tramite aggiornamenti di rete manuali durante gli eventi di failover, ad esempio modificando le tabelle di instradamento e ripubblicando la subnet tramite i collegamenti DRG.

La risoluzione DNS è fondamentale per il failover e la disponibilità del servizio. Pertanto, verrà creata una subnet di servizi dedicati in ogni VCN per ospitare il DNS e l'infrastruttura di supporto.

Per semplicità di applicazione tag VLAN:

  • Le tag VLAN nell'intervallo 100 sono specifiche all'area, limitate ai rispettivi siti.
  • Le tag VLAN nell'intervallo 200 sono associate alla subnet 172.45.0.0/16 e float between sites.

Con il design di alto livello definito, ora entriamo nella configurazione pratica di ogni sito, a partire dalla regione Primaria.