Distribuire un cluster di memorizzazione ad alte prestazioni utilizzando la scala dello spettro IBM

IBM Spectrum Scale è un file system cluster che fornisce l'accesso concorrente a uno o più file system da più nodi. I nodi possono essere collegati a SAN, collegati in rete, una miscela di SAN e collegati in rete o in una configurazione cluster condivisa. Spectrum Scale consente l'accesso ad alte prestazioni a un set di dati comune per supportare una soluzione di scale out o per fornire una piattaforma ad alta disponibilità.

Architettura

Un caso d'uso per Spectrum Scale è la distribuzione di applicazioni SAS Grid che necessitano di un solido sottosistema I/O. Questa architettura di riferimento discute della distribuzione di una soluzione di throughput I/O elevata utilizzando un file system IBM Spectrum in Oracle Cloud Infrastructure.

Questa architettura di riferimento utilizza un'area con un dominio di disponibilità e subnet regionali. È possibile utilizzare la stessa architettura di riferimento in un'area con più domini di disponibilità. Si consiglia di utilizzare subnet regionali per la distribuzione, indipendentemente dal numero di domini di disponibilità.

Il seguente diagramma illustra questa architettura di riferimento.

Segue una descrizione dell'immagine specter-oci.png
Descrizione dell'immagine specter-oci.png

L'architettura del file system Spectrum Scale ha i seguenti componenti:

  • Nodo CES

    I nodi CES (Cluster Export Services) possono servire funzioni di protocollo integrate. Questi nodi forniscono l'accesso SMB, NFS o Oggetto ai dati nel file system IBM Spectrum Scale. Questo nodo è facoltativo. Si consiglia di utilizzare una forma VM.Standard2.8 o superiore (almeno due VNIC) per un throughput più elevato.

  • Nodo GUI MGMT

    Questo nodo fornisce un'interfaccia GUI per consentire agli utenti di monitorare il file system della scala spettro. Questo nodo è facoltativo. Si consiglia di utilizzare una forma VM.Standard2.16 o superiore per fornire OCPU e memoria sufficienti.

  • Nodo client

    Questi nodi utilizzano il file system Scala spettro. Vengono serviti dati su disco dai server NSD (Network Shared Disk).

  • Server NSD

    Questi server utilizzano il protocollo NSD per servire i dati ai nodi client in un modello di protocollo client server. I server NSD forniscono l'accesso alla memoria visibile sui server come dispositivi a blocchi locali.

  • Memorizzazione oggetti

    Oracle Cloud Infrastructure Object Storage è un servizio di memorizzazione internet-scale durevole e scalabile.

  • Rete cloud virtuale (VCN) e subnet

    Un VCN è una rete definita dal software impostata in un'area Oracle Cloud Infrastructure. I VCN possono essere segmentati in subnet, che possono essere specifiche di un'area o di un dominio di disponibilità. Sia le subnet specifiche dell'area che quelle specifiche del dominio di disponibilità possono coesistere nello stesso VCN. Una subnet può essere pubblica o privata.

  • Liste di sicurezza

    Per ogni subnet è possibile creare regole di sicurezza che specifichino l'origine, la destinazione e il tipo di traffico che devono essere consentiti all'interno e all'esterno della subnet.

  • Domini di disponibilità

    I domini di disponibilità sono data center indipendenti e autonomi all'interno di un'area. Le risorse fisiche in ogni dominio di disponibilità vengono isolate dalle risorse negli altri domini di disponibilità, che forniscono tolleranza di errore. I domini di disponibilità non condividono infrastrutture quali l'alimentazione o il raffreddamento o la rete di dominio di disponibilità interna. È quindi improbabile che un errore a un dominio di disponibilità influenzi gli altri domini di disponibilità nell'area.

Suggerimenti

Le vostre esigenze potrebbero differire dall'architettura descritta qui. Utilizzare i suggerimenti riportati di seguito come punto di partenza.

  • Forma di calcolo, host bastione

    Un host bastione viene utilizzato per accedere a qualsiasi nodo nella subnet privata. Utilizzare la forma VM.Standard.E2.1 o VM.Standard.E2.2.

  • Forma di computazione, nodo CES

    Utilizzare una forma VM.Standard2.8 o superiore (almeno due VNIC) per un throughput superiore.

  • Forma di computazione, nodo GUI MGMT

    Utilizzare una forma VM.Standard2.16 o superiore per fornire OCPU e memoria sufficienti.

  • Forma di computazione, nodo client

    L'utente può avere più nodi client. Inizia con una forma VM.Standard2.24 e ridimensiona o abbassa in base alle esigenze.

  • Forma di computazione, server NSD

    I server NSD richiedono un elevato throughput e potenza di elaborazione. Utilizzare una forma BM.Standard2.52 o BM.Standard.E2.64. Inoltre, utilizzare almeno due nodi server NSD.

  • VCN

    Quando si crea VCN, determinare il numero di indirizzi IP necessari per le risorse cloud in ogni subnet. Utilizzando la notazione CIDR (Classless Inter-Domain Routing), specificare una maschera subnet e un intervallo di indirizzi di rete sufficientemente grande per gli indirizzi IP richiesti. Utilizzare un intervallo di indirizzi all'interno dello spazio degli indirizzi IP privati standard.

    Selezionare un intervallo di indirizzi che non si sovrapponga alla rete in locale, in modo da poter impostare una connessione tra VCN e la rete in locale, se necessario.

    Dopo aver creato un VCN, non è possibile modificarne l'intervallo di indirizzi.

    Quando si progettano le subnet, prendere in considerazione il flusso di traffico e i requisiti di sicurezza. Allegare tutte le risorse all'interno di uno specifico livello o ruolo alla stessa subnet, che può fungere da limite di sicurezza.

    Utilizzare subnet regionali.

  • Liste di sicurezza

    Utilizzare le liste di sicurezza per definire le regole di ingresso e di uscita che si applicano all'intera subnet. Ad esempio, questa architettura consente a ICMP internamente per l'intera subnet privata.

Considerazioni

  • Prestazioni

    Per ottenere le migliori prestazioni, scegliere la forma di calcolo corretta con la larghezza di banda appropriata.

  • Disponibilità

    Prendere in considerazione l'utilizzo di un'opzione ad alta disponibilità in base al requisito di distribuzione.

  • Costo

    Le istanze Bare Metal offrono prestazioni più elevate nelle operazioni di I/O per un costo maggiore. Valuta le tue esigenze per scegliere la forma di calcolo appropriata.

  • Monitoraggio e avvisi

    Impostare il monitoraggio e gli avvisi sull'uso della CPU e della memoria per i nodi in modo da scalare la forma su o giù in base alle esigenze.

Distribuisci

Il codice Terraform per distribuire questa architettura di riferimento è disponibile su GitHub.

  1. Andare a GitHub.
  2. Duplicare o scaricare il repository nel computer locale.
  3. Seguire le istruzioni contenute nel documento README.