Exemple de workflow

Cet exemple de workflow montre comment une équipe d'ingénierie automobile utilise une plate-forme de calcul hautes performances pour réduire les coûts de conception, augmenter l'efficacité et augmenter la valeur globale.

Configurer l'infrastructure

Les ingénieurs ont rencontré des temps de mise en file d'attente élevés dans leur environnement sur site et doivent exécuter plusieurs variantes d'une simulation nécessitant 72 coeurs. L'ingénieur de conception doit exécuter les simulations et rapporter les résultats à la direction en quelques heures, cependant, le temps d'attente de la file d'attente pour un environnement HPC sur site est de 5 jours. L'ingénieur de conception contacte l'ingénieur d'infrastructure pour obtenir de l'aide afin de lancer rapidement l'infrastructure pour exécuter les simulations.

L'ingénieur d'infrastructure lance rapidement un cluster HPC à 2 noeuds sur un système Bare Metal Oracle Cloud Infrastructure (OCI). L'ingénieur d'infrastructure choisit une forme BM.Optimized3.36, conçue pour les charges globales de calcul hautes performances qui nécessitent des coeurs de processeur à fréquence élevée avec RDMA. Grâce à cela, l'ingénieur en infrastructure peut provisionner rapidement le cluster via le gestionnaire de ressources à l'aide de la solution prédéfinie de mise en réseau de cluster d'Oracle. Il peut automatiser cette étape à l'aide d'outils tels que Slurm open source, Altair PBS Professional ou la CLI/le SDK Oracle Cloud.

L'ingénieur d'infrastructure se connecte au cluster nouvellement provisionné et s'assure que tous les logiciels de simulation, noeuds de visualisation, fichiers hôtes, bibliothèques MPI, systèmes de fichiers (tels que NFS), planificateur de batch (tels que Slurm Workload Manager) et outils Ansible requis sont configurés sur le cluster. En outre, l'ingénieur d'infrastructure exécute un test de latence rapide, en s'assurant que RDMA est correctement configuré (la latence doit être comprise entre 1 et 3 microsecondes) avant de le transmettre à l'ingénieur de conception.

Exécuter les modèles

L'ingénieur de conception accède au cluster et utilise un script Ansible pour installer rapidement le modèle standard de moto sur le cluster à 2 noeuds. Cet exemple utilise OpenFOAM compilé avec des MPI Intel.

Pour exécuter la simulation, l'ingénieur de conception se déplace vers le noeud de bastion et lance les travaux à l'aide de la planification Slurm Workload Manager. L'ingénieur peut planifier le premier travail et l'exécuter sur le cluster à 72 coeurs alors que les autres sont toujours dans la file d'attente. Comme il ne s'agit que d'un cluster à 2 noeuds, des noeuds supplémentaires sont provisionnés sur 8 noeuds pour exécuter les 4 travaux. A chaque exécution du travail, les noeuds correspondants se terminent automatiquement pour réduire les coûts. L'ingénieur peut extraire les résultats pour chaque ID de travail et recevoir des notifications une fois chaque travail terminé.

L'ingénieur de conception peut prendre l'une des sorties de simulation et la modéliser dans ParaView sur une machine virtuelle d'unité de traitement graphique (machine virtuelle GPU). Par exemple, le modèle peut afficher le flux d'air, la pression, la turbulence ou un autre paramètre.

Description de l'image run-summary.png
Description de l'illustration run-summary.png

L'ingénieur de conception peut exécuter un script rapide pour enregistrer les sorties de modèle dans Oracle Cloud Infrastructure Object Storage en vue d'une utilisation ultérieure. L'ingénieur peut automatiser l'ensemble du processus de simulation et le télécharger vers le stockage d'objets.

Si nécessaire, ils peuvent utiliser Oracle Cloud Infrastructure FastConnect pour extraire les données en local sans frais de sortie.

Afficher les données

Dans cet exemple, le responsable des opérations techniques s'intéresse à la durée des simulations dans le cloud et à leur coût. Les données d'utilisation du calcul hautes performances sont capturées dans une base de données, qui est utilisée pour l'analyse des coûts.

L'exemple suivant illustre le temps de simulation sur le calcul hautes performances Oracle Cloud Infrastructure (OCI) par rapport aux temps de simulation à partir d'un système sur site, et montre le temps global économisé sur l'exécution du calcul hautes performances sur OCI par rapport aux coûts sur site et les coûts associés. Dans cet exemple, un cluster OCI HPC à 8 noeuds a été utilisé pour un total de 2 heures, et à 0,075 $ par coeur, ce montant s'élève à 2,70 $ par instance par heure ou à 21,60 $ au total pour les 2 heures.

Dans une application réelle, les économies de temps et de coût liées à l'exécution dans le cloud sont généralement plus importantes que dans cet exemple particulier. En éclatant dans le cloud ou en passant entièrement au cloud, la capacité à la demande permet des itérations plus rapides et des améliorations du modèle existant sont possibles, ouvrant la voie à une conception de produit plus rapide, à des performances et à une mise à disposition plus rapide.

Description de manager-dashboard.png
Description de l'illustration manager-dashboard.png