Exemplo de Workflow
Este exemplo de workflow mostra como uma equipe de engenharia de veículos usa uma plataforma de computação de alto desempenho para reduzir os custos de design, aumentar a eficiência e aumentar o valor geral.
Configurar a Infraestrutura
O Engenheiro de Infraestrutura inicia rapidamente um cluster HPC de 2 nós em um sistema bare metal da Oracle Cloud Infrastructure (OCI). O Engenheiro de Infraestrutura escolhe uma forma BM.Optimized3.36
, projetada para cargas de trabalho de computação de alto desempenho que exigem núcleos de processador de alta frequência com RDMA. Com isso, o Engenheiro de Infraestrutura pode provisionar rapidamente o cluster por meio do gerenciador de recursos usando a solução predefinida de rede de cluster da Oracle e pode automatizar essa etapa com ferramentas como Slurm de código aberto, Altair PBS Professional ou Oracle Cloud SDK/CLI.
O Engenheiro de Infraestrutura se conecta ao cluster recém-provisionado e garante que todos os softwares de simulação necessários, nós de visualização, arquivos de host, bibliotecas MPI, sistemas de arquivos (como NFS), programador batch (como Slurm Workload Manager) e ferramentas Ansible sejam configurados no cluster. Além disso, o Engenheiro de Infraestrutura executa um teste de latência rápida, garantindo que o RDMA esteja configurado corretamente (a latência deve estar entre 1 e 3 microssegundos) antes de transmiti-lo ao Engenheiro de Design.
Executar os Modelos
O Engenheiro de Design acessa o cluster e usa um script Ansible para instalar rapidamente o modelo padrão de moto no cluster de 2 nós. Este exemplo usa OpenFOAM compilado com MPIs Intel.
Para executar a simulação, o Engenheiro de Design move-se para o nó bastion, inicia jobs usando a programação do Slurm Workload Manager. O engenheiro pode programar o primeiro job e executá-lo no cluster de 72 núcleos, enquanto os outros ainda estão na fila. Como ele é apenas um cluster de 2 nós, nós adicionais são provisionados para 8 nós para executar todos os 4 jobs. À medida que cada job é concluído, os nós correspondentes são encerrados automaticamente para economizar custos. O engenheiro pode recuperar os resultados de cada ID de job e receber notificações após a conclusão de cada job.
O Engenheiro de Design pode pegar uma das saídas de simulação e modelá-la em ParaView em uma máquina virtual de unidade de processamento gráfico (VM GPU). Por exemplo, o modelo pode mostrar fluxo de ar, pressão, turbulência ou outro parâmetro.

Descrição da ilustração run-summary.png
O Engenheiro de Design pode executar um script rápido para salvar as saídas do modelo no Oracle Cloud Infrastructure Object Storage para uso posterior. O engenheiro pode automatizar todo o processo de simulação e fazer upload para o armazenamento de objetos.
Se necessário, eles podem usar o Oracle Cloud Infrastructure FastConnect para recuperar os dados localmente sem incorrer em taxas de saída.
Exibir os Dados
O exemplo a seguir é o tempo de simulação na HPC da Oracle Cloud Infrastructure (OCI) versus os tempos de simulação de um sistema on-premises e mostra o tempo geral economizado da execução de HPC na OCI versus on-premises e os custos associados. No exemplo, um cluster de HPC da OCI de 8 nós foi usado por um total de 2 horas e, a US$ 0,075 por núcleo, isso equivale a US$ 2,70 por instância por hora ou US$ 21,60 totais para as 2 horas.
Em um aplicativo do mundo real, a economia de custo e tempo da execução na nuvem geralmente é mais significativa do que neste exemplo específico. Ao expandir na nuvem ou migrar totalmente para a nuvem, a capacidade sob demanda permite iterações mais rápidas e melhorias no modelo existente são possíveis, abrindo caminho para um design, desempenho e tempo de lançamento mais rápidos do produto.

Descrição da ilustração manager-dashboard.png