Flusso di lavoro di esempio

Questo esempio di flusso di lavoro mostra come un team di ingegneria dei veicoli utilizza una piattaforma di calcolo ad alte prestazioni per ridurre i costi di progettazione, aumentare l'efficienza e aumentare il valore complessivo.

Impostare l'infrastruttura

Gli ingegneri hanno riscontrato tempi di accodamento elevati nell'ambiente on premise e devono eseguire diverse varianti di una simulazione che richiede 72 memorie centrali. Il Design Engineer deve eseguire le simulazioni e segnalare i risultati al management entro un paio d'ore, tuttavia il tempo di attesa in coda per un ambiente HPC on-premise è di 5 giorni. Il Design Engineer si rivolge all'Infrastructure Engineer per ricevere supporto per lanciare rapidamente l'infrastruttura per eseguire le simulazioni.

Infrastructure Engineer lancia rapidamente un cluster HPC a 2 nodi su un sistema bare metal Oracle Cloud Infrastructure (OCI). Infrastructure Engineer sceglie una forma BM.Optimized3.36, progettata per carichi di lavoro di elaborazione ad alte prestazioni che richiedono core di processore ad alta frequenza con RDMA. In questo modo, l'Infrastructure Engineer può eseguire rapidamente il provisioning del cluster tramite Resource Manager utilizzando la soluzione predefinita di rete di cluster di Oracle e può automatizzare questo passaggio con strumenti come Slurm open source, Altair PBS Professional o Oracle Cloud SDK/CLI.

L'Infrastructure Engineer si connette al cluster di cui è stato appena eseguito il provisioning e garantisce che tutti i software di simulazione necessari, i nodi di visualizzazione, i file host, le librerie MPI, i file system (come NFS), lo scheduler batch (come Slurm Workload Manager) e gli strumenti Ansible siano impostati sul cluster. Inoltre, Infrastructure Engineer esegue un test di latenza rapida, assicurando che RDMA sia impostato correttamente (la latenza deve essere compresa tra 1 e 3 microsecondi) prima di passarlo al Design Engineer.

Esegui i modelli

Il Design Engineer accede al cluster e utilizza uno script Ansible per installare rapidamente il modello standard della moto nel cluster a 2 nodi. In questo esempio viene utilizzato OpenFOAM compilato con gli MPI Intel.

Per eseguire la simulazione, il Design Engineer passa al nodo bastion e avvia i job utilizzando la pianificazione di Slurm Workload Manager. Il tecnico può pianificare il primo job ed eseguirlo nel cluster di 72 core mentre gli altri sono ancora in coda. Poiché si tratta solo di un cluster a 2 nodi, viene eseguito il provisioning di nodi aggiuntivi a 8 nodi per eseguire tutti e 4 i job. Al termine di ogni job, i nodi corrispondenti vengono terminati automaticamente per risparmiare sui costi. Il tecnico può recuperare i risultati per ogni ID job e ricevere notifiche dopo il completamento di ogni job.

Il Design Engineer può prendere una delle uscite di simulazione e modellarla in ParaView su una macchina virtuale di unità di elaborazione grafica (GPU VM). Ad esempio, il modello potrebbe mostrare flusso d'aria, pressione, turbolenza o un altro parametro.

Descrizione di run-summary.png
Descrizione dell'immagine run-summary.png

Il Design Engineer può eseguire uno script rapido per salvare gli output del modello in Oracle Cloud Infrastructure Object Storage per utilizzarlo in un secondo momento. Il tecnico può automatizzare l'intero processo di simulazione e caricarlo nello storage degli oggetti.

Se necessario, possono utilizzare Oracle Cloud Infrastructure FastConnect per estrarre i dati a livello locale senza incorrere in costi di uscita.

Visualizza dati

In questo esempio, il Technical Operations Manager è interessato a quanto tempo le simulazioni hanno impiegato nel cloud e quanto costa. I dati di utilizzo HPC vengono acquisiti in un database, utilizzato per l'analisi dei costi.

L'esempio seguente mostra il tempo di simulazione su Oracle Cloud Infrastructure (OCI) HPC rispetto ai tempi di simulazione di un sistema on-premise e mostra il tempo complessivo risparmiato dall'esecuzione di HPC su OCI rispetto ai costi on-premise e associati. Nell'esempio, un cluster HPC OCI a 8 nodi è stato utilizzato per un totale di 2 ore e, a $ 0,075 per core, questo ammonta a $ 2,70 dollari per istanza all'ora o $ 21,60 dollari totali per le 2 ore.

In un'applicazione reale, i risparmi in termini di costi e tempo derivanti dall'esecuzione nel cloud sono in genere più significativi rispetto a questo esempio specifico. Espandendo nel cloud o passando completamente al cloud, la capacità on-demand consente iterazioni più rapide e sono possibili miglioramenti al modello esistente, aprendo la strada a una progettazione del prodotto, a prestazioni e a tempi di rilascio più rapidi.

Descrizione del manager-dashboard.png
Descrizione dell'immagine manager-dashboard.png