Exemplo de Workflow

Este exemplo de workflow mostra como uma equipe de engenharia de veículos usa uma plataforma de computação de alto desempenho para reduzir os custos de design, aumentar a eficiência e aumentar o valor geral.

Configurar a Infraestrutura

Os engenheiros encontraram altos tempos de filas em seu ambiente on-premises e devem executar várias variações de uma simulação que exija 72 núcleos. O Engenheiro de Design deve executar as simulações e reportar os resultados ao gerenciamento em algumas horas, no entanto, o tempo de espera na fila para um ambiente HPC local é de 5 dias. O Engenheiro de Design entra em contato com o Engenheiro de Infraestrutura para obter suporte para lançar rapidamente a infraestrutura para executar as simulações.

O Engenheiro de Infraestrutura inicia rapidamente um cluster HPC de 2 nós em um sistema bare metal da Oracle Cloud Infrastructure (OCI). O Engenheiro de Infraestrutura escolhe uma forma BM.Optimized3.36, projetada para cargas de trabalho de computação de alto desempenho que exigem núcleos de processador de alta frequência com RDMA. Com isso, o Engenheiro de Infraestrutura pode provisionar rapidamente o cluster por meio do gerenciador de recursos usando a solução predefinida de rede de cluster da Oracle e pode automatizar essa etapa com ferramentas como Slurm de código aberto, Altair PBS Professional ou Oracle Cloud SDK/CLI.

O Engenheiro de Infraestrutura se conecta ao cluster recém-provisionado e garante que todos os softwares de simulação necessários, nós de visualização, arquivos de host, bibliotecas MPI, sistemas de arquivos (como NFS), programador batch (como Slurm Workload Manager) e ferramentas Ansible sejam configurados no cluster. Além disso, o Engenheiro de Infraestrutura executa um teste de latência rápida, garantindo que o RDMA esteja configurado corretamente (a latência deve estar entre 1 e 3 microssegundos) antes de transmiti-lo ao Engenheiro de Design.

Executar os Modelos

O Engenheiro de Design acessa o cluster e usa um script Ansible para instalar rapidamente o modelo padrão de moto no cluster de 2 nós. Este exemplo usa OpenFOAM compilado com MPIs Intel.

Para executar a simulação, o Engenheiro de Design move-se para o nó bastion, inicia jobs usando a programação do Slurm Workload Manager. O engenheiro pode programar o primeiro job e executá-lo no cluster de 72 núcleos, enquanto os outros ainda estão na fila. Como ele é apenas um cluster de 2 nós, nós adicionais são provisionados para 8 nós para executar todos os 4 jobs. À medida que cada job é concluído, os nós correspondentes são encerrados automaticamente para economizar custos. O engenheiro pode recuperar os resultados de cada ID de job e receber notificações após a conclusão de cada job.

O Engenheiro de Design pode pegar uma das saídas de simulação e modelá-la em ParaView em uma máquina virtual de unidade de processamento gráfico (VM GPU). Por exemplo, o modelo pode mostrar fluxo de ar, pressão, turbulência ou outro parâmetro.

Veja a seguir a descrição da execução-summary.png
Descrição da ilustração run-summary.png

O Engenheiro de Design pode executar um script rápido para salvar as saídas do modelo no Oracle Cloud Infrastructure Object Storage para uso posterior. O engenheiro pode automatizar todo o processo de simulação e fazer upload para o armazenamento de objetos.

Se necessário, eles podem usar o Oracle Cloud Infrastructure FastConnect para recuperar os dados localmente sem incorrer em taxas de saída.

Exibir os Dados

Neste exemplo, o Gerente de Operações Técnicas está interessado em quanto tempo as simulações levaram na nuvem e quanto custa. Os dados de uso de HPC são capturados em um banco de dados, que é usado para análise de custos.

O exemplo a seguir é o tempo de simulação na HPC da Oracle Cloud Infrastructure (OCI) versus os tempos de simulação de um sistema on-premises e mostra o tempo geral economizado da execução de HPC na OCI versus on-premises e os custos associados. No exemplo, um cluster de HPC da OCI de 8 nós foi usado por um total de 2 horas e, a US$ 0,075 por núcleo, isso equivale a US$ 2,70 por instância por hora ou US$ 21,60 totais para as 2 horas.

Em um aplicativo do mundo real, a economia de custo e tempo da execução na nuvem geralmente é mais significativa do que neste exemplo específico. Ao expandir na nuvem ou migrar totalmente para a nuvem, a capacidade sob demanda permite iterações mais rápidas e melhorias no modelo existente são possíveis, abrindo caminho para um design, desempenho e tempo de lançamento mais rápidos do produto.

Veja a seguir a descrição do gerente-dashboard.png
Descrição da ilustração manager-dashboard.png