Flujo de trabajo de ejemplo
En este ejemplo de flujo de trabajo se muestra cómo un equipo de ingeniería de vehículos utiliza una plataforma informática de alto rendimiento para reducir los costos de diseño, aumentar la eficiencia y aumentar el valor general.
Configuración de la Infraestructura
El ingeniero de infraestructura inicia rápidamente un cluster de HPC de 2 nodos en un sistema con hardware dedicado de Oracle Cloud Infrastructure (OCI). El ingeniero de infraestructura elige una unidad BM.Optimized3.36
, que está diseñada para cargas de trabajo informáticas de alto rendimiento que requieren núcleos de procesador de alta frecuencia con RDMA. Con esto, el ingeniero de infraestructura puede aprovisionar rápidamente el cluster mediante el gestor de recursos, utilizando la solución predefinida de redes de cluster de Oracle, y puede automatizar este paso con herramientas como Slurm de código abierto, Altair PBS Professional o el SDK/CLI de Oracle Cloud.
El ingeniero de infraestructura se conecta al cluster recién aprovisionado y garantiza que todo el software de simulación necesario, los nodos de visualización, los archivos de host, las bibliotecas MPI, los sistemas de archivos (como NFS), el programador por lotes (como Slurm Workload Manager) y las herramientas de Ansible estén configurados en el cluster. Además, el ingeniero de infraestructura ejecuta una prueba de latencia rápida, lo que garantiza que RDMA esté configurado correctamente (la latencia debe estar entre 1 y 3 microsegundos) antes de pasarla al ingeniero de diseño.
Ejecución de los modelos
El ingeniero de diseño accede al cluster y utiliza un script de Ansible para instalar rápidamente el modelo estándar de motocicleta en el cluster de 2 nodos. En este ejemplo se utiliza OpenFOAM compilado con MPI de Intel.
Para ejecutar la simulación, el ingeniero de diseño se mueve al nodo bastión, inicia los trabajos mediante la programación de Slurm Workload Manager. El ingeniero puede programar el primer trabajo y ejecutarlo en el cluster de 72 núcleos mientras los demás siguen en la cola. Debido a que es solo un cluster de 2 nodos, se aprovisionan nodos adicionales en 8 nodos para ejecutar los 4 trabajos. A medida que se completa cada trabajo, los nodos correspondientes terminan automáticamente para ahorrar en costos. El ingeniero puede recuperar resultados para cada ID de trabajo y recibir notificaciones después de la finalización de cada trabajo.
El ingeniero de diseño puede tomar una de las salidas de simulación y modelarla en ParaView en una máquina virtual de unidad de procesamiento gráfico (VM GPU). Por ejemplo, el modelo puede mostrar flujo de aire, presión, turbulencia u otro parámetro.

Descripción de la ilustración run-summary.png
El ingeniero de diseño puede ejecutar un script rápido para guardar las salidas del modelo en Oracle Cloud Infrastructure Object Storage para su uso posterior. El ingeniero puede automatizar todo el proceso de simulación y cargarlo en Object Storage.
Si es necesario, pueden utilizar Oracle Cloud Infrastructure FastConnect para recuperar los datos localmente sin incurrir en ninguna tarifa de salida.
Mostrar los datos
El siguiente ejemplo es el tiempo de simulación en Oracle Cloud Infrastructure (OCI) HPC frente a los tiempos de simulación de un sistema local y muestra el tiempo total ahorrado de ejecutar HPC en OCI frente a los entornos locales, y los costos asociados. En el ejemplo, se utilizó un cluster de HPC de OCI de 8 nodos durante un total de 2 horas, y a $0.075 por núcleo, esto equivale a $2.70 dólares por instancia por hora o $21.60 dólares en total durante las 2 horas.
En una aplicación real, el ahorro de tiempo y costos derivado de la ejecución en la nube suele ser más significativo que en este ejemplo concreto. Al expandirse en la nube o trasladarse completamente a la nube, la capacidad bajo demanda permite iteraciones más rápidas y es posible mejorar el modelo existente, allanando el camino para un diseño, rendimiento y tiempo de lanzamiento más rápidos del producto.

Descripción de la ilustración manager-dashboard.png