Impostazione di un ambiente CAE mediante Altair HyperWorks con Oracle Cloud Guard

Scegli i tuoi tecnici dalle limitazioni hardware on premise in modo da poter eseguire grandi simulazioni di ingegneria in qualsiasi momento del mondo da quasi tutti i dispositivi.

Altair HyperWorks è una suite software di progettazione in esecuzione su Oracle Cloud Infrastructure che consente ai tecnici di creare modelli e di eseguire analisi e ottimizzazione di progettazione per i requisiti delle prestazioni diversi. Oracle Cloud Infrastructure fornisce le istanze di rete cluster remote dedicate all'accesso diretto alla memoria (RDMA)e HPC (High Performance Computing) con tecnologia Bare Metal. Oracle Cloud Infrastructure combina ora la propria istanza HPC collaudata con una rete a bassa latenza che può estendersi su più di 20,000 memorie centrali.

Altair fornisce inoltre un servizio gestito denominato Altair HyperWorks Illimitato simile a questa distribuzione offerta:

  • Tempi di progettazione ridotti: le società possono ridurre i tempi di progettazione e portare i prodotti al mercato più velocemente accedendo al software e all'hardware su richiesta.

  • Nessuna in attesa: con questa soluzione su richiesta da Oracle e Altair, i tecnici non devono attendere nelle code dei job o nei cicli di approvvigionamento hardware HPC di lunga durata.

  • Licenza flessibile: il modello di gestione delle licenze innovative Altair consente ai clienti di utilizzare licenze software illimitate nell'ambiente dei servizi gestiti.

Architettura

Questa architettura distribuisce un nodo di testa che esegue lo scheduler, il provisioning e l'annullamento del provisioning HPC (High Performance Computing) per calcolare i cluster di nodi e pre-elaborare alcuni dati dei clienti. Il lavoro viene eseguito nel cluster di nodi di calcolo HPC e i risultati vengono memorizzati nella memoria dei file.

Questa architettura viene distribuita mediante una rete VCN (Virtual Cloud Network) privata. La rete di clienti può accedere al nodo principale solo tramite IPSec VPN o FastConnect. Questa limitazione fornisce un accesso controllato al nodo principale. Per casi d'uso specifici, tuttavia, i clienti possono scegliere di distribuire questa architettura in una subnet pubblica in cui sia possibile accedere anche al nodo principale da Internet pubblico.

L'architettura utilizza anche Oracle Cloud Guard, che monitora continuamente configurazioni e attività per identificare le minacce e agisce automaticamente per risolvere i problemi a livello di compartimento.

L'architettura utilizza un'area con un dominio di disponibilità e subnet regionali. È possibile utilizzare la stessa architettura in un'area con più domini di disponibilità. Si consiglia di utilizzare subnet regionali per la distribuzione, indipendentemente dal numero di domini di disponibilità.

Nota:

Se si utilizza FastConnect, eseguire il MOUNT dello storage di file sul nodo in locale per eseguire un trasferimento più rapido del data set. Se si utilizza IPSec VPN, trasferire prima i dati allo storage degli oggetti (a causa della velocità e delle variazioni di connessione), quindi trasferirli allo storage di file.

L'architettura comprende i componenti riportati di seguito.



  • Area

    Un'area Oracle Cloud Infrastructure è un'area geografica localizzata contenente uno o più data center, denominati domini di disponibilità. Le regioni sono indipendenti da altre regioni e vaste distanze possono separarle (tra paesi o addirittura continenti).

  • Domini di disponibilità

    I domini di disponibilità sono data center standalone e indipendenti all'interno di un'area. Le risorse fisiche in ciascun dominio di disponibilità sono isolate dalle risorse negli altri domini di disponibilità che forniscono la tolleranza degli errori. I domini di disponibilità non condividono l'infrastruttura, ad esempio l'alimentazione o il raffreddamento, né la rete di domini di disponibilità interna. Pertanto, un errore in un dominio di disponibilità non influisce sugli altri domini di disponibilità presenti nell'area.

  • Domini di errore

    Un dominio di errore è un raggruppamento di hardware e infrastruttura all'interno di un dominio di disponibilità. Ogni dominio di disponibilità ha tre domini di errore con alimentazione e hardware indipendenti. Quando si distribuiscono risorse su più domini di errore, le applicazioni possono tollerare errori fisici del server, manutenzione del sistema e errori di alimentazione all'interno di un dominio di errore.

  • Rete cloud virtuale (VCN) e subnet

    VCN è una rete personalizzabile definita dal software impostata in un'area Oracle Cloud Infrastructure. Come le reti tradizionali dei data center, i VCN consentono di controllare completamente l'ambiente di rete. Un VCN può avere più blocchi CIDR non sovrapposti che è possibile modificare dopo aver creato VCN. È possibile segmentare un VCN in subnet, che possono essere definite in un'area o in un dominio di disponibilità. Ogni subnet è costituita da un intervallo contiguo di indirizzi che non si sovrappongono alle altre subnet di VCN. È possibile modificare la dimensione di una subnet dopo la creazione. Una subnet può essere pubblica o privata.

  • Nodo principale

    Utilizzare un portale basato su Web per connettersi al nodo del livello superiore e pianificare i job HPC. La richiesta di job viene inviata da FastConnect o IPSec VPN al nodo principale. Inoltre, il nodo principale invia il set di dati del cliente allo storage di file e può eseguire una preelaborazione dei dati.

    Il nodo del livello superiore esegue il provisioning dei cluster di nodi HPC e annulla il provisioning dei cluster HPC al completamento del job.

  • Nodo cluster HPC

    Il nodo head esegue il provisioning e annulla il provisioning di questi nodi di calcolo, che sono cluster abilitati per la utility RDMA- . Elaborano i dati memorizzati nella memoria dei file e restituiscono i risultati alla memorizzazione dei file.

  • Cloud guard

    È possibile utilizzare Oracle Cloud Guard per monitorare e mantenere la sicurezza delle risorse nel cloud. Cloud Guard esamina le risorse per individuare la debolezza della sicurezza relativa alla configurazione e monitora gli operatori e gli utenti per le attività rischiose. Quando viene identificato un problema o un rischio di sicurezza, Cloud Guard consiglia azioni correttive e assiste l'utente nell'esecuzione di tali azioni, in base alle ricette di sicurezza che è possibile definire.

  • Memorizzazione file

    Il file system del servizio di storage di file è installato sia sul nodo dell'unità che sui nodi del cluster HPC. Memorizza il set di dati del cliente e i risultati dopo l'elaborazione dei dati da parte dei nodi del cluster HPC.

  • Lista di sicurezza

    Per ogni subnet è possibile creare regole di sicurezza che specificano l'origine, la destinazione e il tipo di traffico consentito nella subnet e viceversa.

Suggerimenti

I requisiti dell'utente potrebbero differire dall'architettura descritta qui. Utilizzare i seguenti suggerimenti come punto di partenza.

  • VCN

    Quando si crea un VCN, determinare il numero di blocchi CIDR necessari e la dimensione di ogni blocco in base al numero di risorse che si prevede di associare alle subnet in VCN. Utilizzare blocchi CIDR che si trovano all'interno dello spazio degli indirizzi IP privati standard.

    Selezionare i blocchi CIDR che non si sovrappongono ad altre reti (in Oracle Cloud Infrastructure, nel data center in locale o in un altro provider cloud) a cui si desidera impostare le connessioni private.

    Dopo aver creato un VCN, è possibile modificare, aggiungere e rimuovere i relativi blocchi CIDR.

    Quando si progettano le subnet, prendere in considerazione il flusso di traffico e i requisiti di sicurezza. Allegare tutte le risorse all'interno di uno specifico livello o ruolo alla stessa subnet, che può fungere da limite di sicurezza.

    Utilizzare subnet regionali.

  • Liste di sicurezza

    Usare gli elenchi di sicurezza per definire le regole di entrata e uscita che si applicano all'intera subnet.

  • Cloud Guard

    Duplicare e personalizzare le ricette predefinite fornite da Oracle per creare ricette di rilevatori e rispondenti personalizzate. Queste composizioni consentono di specificare il tipo di violazioni della sicurezza che generano un'avvertenza e le azioni che possono essere eseguite su di esse. Ad esempio, è possibile rilevare i bucket di storage degli oggetti con visibilità impostata su pubblica.

    Applicare Cloud Guard a livello di tenancy per coprire l'ambito più ampio e ridurre l'onere amministrativo della gestione di più configurazioni.

    È inoltre possibile utilizzare la funzione Elenco gestito per applicare determinate configurazioni ai rilevatori.

  • Nodo principale

    Utilizzare la forma VM.DenseIO2.24 Compute. Fornisce uno storage NVME collegato a livello locale, che velocizza la pre-elaborazione dei dati.

    Il nodo intestazione esiste solo nei compartimenti con Cloud Guard abilitato. È possibile duplicare e modificare la ricetta predefinita per il rilevatore e il rispondente per qualsiasi requisito specifico. Si consiglia di utilizzare la ricetta predefinita.

  • Nodo del cluster HPC

    Utilizzare la forma di computazione di BM.HPC2.36. Questa forma contiene 36 core di due processori 3.7GHz Intel Xeon Gold 6154, 384-GB RAM e 6.4-TB NVME. Utilizzando potenti GPU NVIDIA disponibili su Oracle Cloud Infrastructure, è possibile eseguire il post-elaborazione dei risultati sul cloud mediante la visualizzazione remota.

    Il nodo cluster HPC esiste nei compartimenti solo con Cloud Guard abilitato. È possibile duplicare e modificare la ricetta predefinita per il rilevatore e il rispondente per qualsiasi requisito specifico. Si consiglia di utilizzare la ricetta predefinita.

Considerazioni

Durante la distribuzione di questa architettura di riferimento, tenere presente quanto riportato di seguito.

  • Prestazioni

    Per ottenere le migliori prestazioni, scegliere la forma di computazione corretta con la larghezza di banda appropriata.

  • Disponibilità

    Si consiglia di utilizzare un'opzione ad alta disponibilità in base ai requisiti di distribuzione e all'area. Le opzioni disponibili includono l'uso di più domini di disponibilità in un'area e in domini di errore.

  • Costo

    Un'istanza GPU Bare Metal fornisce la potenza CPU necessaria per un costo più elevato. Valutare i requisiti per scegliere la forma di computazione appropriata.

  • Monitoraggio e alert

    Impostare il monitoraggio e gli avvisi relativi all'uso della CPU e della memoria per i nodi in modo da poter ridimensionare la forma in base alle esigenze.

Log delle modifiche

Questo log elenca modifiche significative: