Configurar um Ambiente CAE Usando o Altair HyperWorks com o Oracle Cloud Guard
Libere seus engenheiros de restrições de hardware locais para que eles possam executar simulações massivas de engenharia em qualquer lugar do mundo em quase qualquer dispositivo.
A Altair HyperWorks é uma suíte de software de engenharia em execução no Oracle Cloud Infrastructure que permite a engenharia de modelos que criam modelos e executam análise de engenharia e otimização de design para diferentes requisitos de desempenho. O Oracle Cloud Infrastructure fornece instâncias de HPC (remote direct memory access)-enabled cluster networking and bare-metal de computação de alto desempenho (HPC). O Oracle Cloud Infrastructure agora combina sua instância HPC comprovada com uma rede com baixa latência que pode abranger mais de 20,000 núcleos.
Além disso, a Altair oferece um serviço gerenciado chamado Altair HyperWorks Ilimitado, semelhante a essa implantação que oferece:
-
Tempos de design reduzidos: as empresas podem reduzir os tempos de design e trazer produtos para o mercado mais rápido, acessando software e hardware sob demanda.
-
Sem espera: Com esta solução sob demanda da Oracle e da Altair, os engenheiros não precisam aguardar as filas de job ou suportar longos ciclos de compra de hardware HPC.
-
Licenciamento flexível: O modelo de licenciamento inovador da Altair permite que os clientes usem licenças de software ilimitadas no ambiente de serviço gerenciado.
Arquitetura
Esta arquitetura implanta um nó principal, que executa os clusters de nó de computação HPC (computação de alto desempenho) do scheduler, provisões e desprovisões e pré-processa alguns dados do cliente. O trabalho é feito no cluster de nós de computação HPC e os resultados são armazenados no armazenamento de arquivos.
Essa arquitetura é implantada usando uma VCN (rede virtual na nuvem) privada. A rede do cliente só pode acessar o nó principal por meio do IPSec VPN ou do FastConnect. Essa limitação fornece acesso controlado ao nó do cabeçalho. No entanto, para casos de uso específicos, os clientes podem optar por implantar essa arquitetura em uma sub-rede pública, onde o nó principal também pode ser acessado pela internet pública.
A arquitetura também usa o Oracle Cloud Guard, que monitora continuamente configurações e atividades para identificar ameaças e atua automaticamente para corrigir problemas em um nível de compartimento.
A arquitetura usa uma região com um domínio de disponibilidade e sub-redes regionais. Você pode usar a mesma arquitetura em uma região com vários domínios de disponibilidade. Recomendamos que você use sub-redes regionais para sua implantação, independentemente do número de domínios de disponibilidade.
Observação:
Se você usar o FastConnect, monte o armazenamento de arquivos para o nó on-premises para obter uma transferência mais rápida do conjunto de dados. Se você usar um IPSec VPN, transfira os dados para o armazenamento de objetos primeiro (por causa de variações de velocidade e conexão) e, em seguida, transfira-o para o armazenamento de arquivos.A arquitetura tem os seguintes componentes:
- Região
Uma região do Oracle Cloud Infrastructure é uma área geográfica localizada que contém um ou mais data centers, chamados domínios de disponibilidade. As regiões são independentes de outras regiões, e vastas distâncias podem separá-las (entre países ou mesmo continentes).
- Domínios de disponibilidade
Os domínios de disponibilidade são independentes, data centers independentes em uma região. Os recursos físicos em cada domínio de disponibilidade são isolados dos recursos nos outros domínios de disponibilidade, que fornecem tolerância a falhas. Os domínios de disponibilidade não compartilham infraestrutura, como energia ou refrigeração, ou a rede de domínio de disponibilidade interna. Portanto, uma falha em um domínio de disponibilidade provavelmente afetará os outros domínios de disponibilidade da região.
- Domínios de falha
Um domínio de falha é um agrupamento de hardware e infraestrutura dentro de um domínio de disponibilidade. Cada domínio de disponibilidade tem três domínios de falha com energia e hardware independentes. Quando você distribui recursos entre vários domínios de falha, seus aplicativos podem tolerar falhas físicas do servidor, manutenção do sistema e falhas de energia dentro de um domínio de falha.
- Rede virtual na nuvem (VCN) e sub-redes
Um VCN é uma rede personalizável definida por software que você configura em uma região do Oracle Cloud Infrastructure. Como as redes tradicionais de data center, VCNs oferecem controle completo sobre seu ambiente de rede. Um VCN pode ter vários blocos CIDR não sobrepostos que você pode alterar depois de criar o VCN. Você pode segmentar um VCN em sub-redes, que podem ter escopo para uma região ou para um domínio de disponibilidade. Cada sub-rede consiste em uma faixa contígua de endereços que não se sobrepõem às outras sub-redes no VCN. É possível alterar o tamanho de uma sub-rede após a criação. Uma sub-rede pode ser pública ou privada.
- Nó principal
Use um portal baseado na Web para estabelecer conexão com o nó principal e programar jobs HPC. A solicitação de job vem por meio do FastConnect ou do IPSec VPN para o nó principal. O nó principal também envia o conjunto de dados do cliente para o armazenamento de arquivos e pode fazer alguns pré-processamentos nos dados.
O nó principal provisiona clusters de nó HPC e cancela o provisionamento de clusters HPC na conclusão do job.
- Nó de cluster HPC
O nó de cabeçalho provisiona e cancela o provisionamento desses nós de cálculo, que são clusters ativados para RDM. Eles processam os dados armazenados no armazenamento de arquivos e retornam os resultados para o armazenamento de arquivos.
- Guarda na nuvem
Você pode usar o Oracle Cloud Guard para monitorar e manter a segurança de seus recursos na nuvem. O Cloud Guard examina seus recursos para obter fraqueza de segurança relacionada à configuração e monitora operadores e usuários para atividades de risco. Quando qualquer problema ou risco de segurança é identificado, o Cloud Guard recomenda ações corretivas e ajuda você a tomar essas ações, com base nas receitas de segurança que você pode definir.
- Armazenamento de arquivos
O sistema de arquivos do File Storage Service é montado nos nós principal e de cluster HPC. Ele armazena o conjunto de dados do cliente e os resultados após os nós de cluster HPC processar os dados.
- Lista de Segurança
Para cada sub-rede, você pode criar regras de segurança que especificam a origem, o destino e o tipo de tráfego que devem ser permitidos dentro e fora da sub-rede.
Recomendações
Seus requisitos podem ser diferentes da arquitetura descrita aqui. Use as recomendações a seguir como ponto de partida.
- VCN
Ao criar um VCN, determine o número de blocos CIDR necessários e o tamanho de cada bloco com base no número de recursos que você planeja anexar às sub-redes no VCN. Use blocos CIDR que estejam dentro do espaço de endereço IP privado padrão.
Selecione blocos CIDR que não se sobreponham a nenhuma outra rede (no Oracle Cloud Infrastructure, no data center local ou em outro provedor de nuvem) para a qual você pretende configurar conexões privadas.
Depois de criar um VCN, você poderá alterar, adicionar e remover seus blocos CIDR.
Ao projetar as sub-redes, considere seus requisitos de fluxo de tráfego e segurança. Anexe todos os recursos dentro de uma camada ou atribuição específica à mesma sub-rede, que pode servir como um limite de segurança.
Use sub-redes regionais.
- Listas de segurança
Use listas de segurança para definir regras de entrada e saída que se aplicam a toda a sub-rede.
- Cloud Guard
Clone e personalize as receitas padrão fornecidas pelo Oracle para criar receitas personalizadas de detector e respondedor. Essas receitas permitem especificar que tipo de violações de segurança geram uma advertência e quais ações podem ser executadas nelas. Por exemplo, talvez você queira detectar buckets do Object Storage que tenham visibilidade definida como pública.
Aplique o Cloud Guard no nível da tenancy para cobrir o escopo mais amplo e reduzir o encargo administrativo de manter várias configurações.
Você também pode usar o recurso Lista Gerenciada para aplicar determinadas configurações aos detectores.
- Nó principal
Use a forma do VM.DenseIO2.24 Compute. Ela fornece armazenamento NVME anexado localmente, que acelera o pré-processamento de dados.
O nó principal existe apenas em compartimentos com o Cloud Guard ativado. Você pode clonar e modificar a receita padrão para detector e respondedor para qualquer requisito específico. É recomendável usar a receita padrão como está.
- Nó de Cluster HPC
Use a forma de Computação do BM.HPC2.36. Esta forma tem 36 núcleos de dois processadores 3.7GHz Intel Xeon Gold 6154, 384 GB de RAM e armazenamento local 6.4-TB NVME. Ao usar GPUs NVIDIA poderosas disponíveis no Oracle Cloud Infrastructure, você pode pós-processar resultados na nuvem por meio de visualização remota.
O nó do cluster HPC existe em compartimentos somente com o Cloud Guard ativado. Você pode clonar e modificar a receita padrão para detector e respondedor para qualquer requisito específico. É recomendável usar a receita padrão como está.
Considerações
Considere o seguinte ao implantar esta arquitetura de referência.
- Desempenho
Para obter o melhor desempenho, escolha a forma de computação correta com largura de banda apropriada.
- Disponibilidade
Considere o uso de uma opção de alta disponibilidade com base nos requisitos de implantação e na região. As opções incluem o uso de vários domínios de disponibilidade em uma região e domínios de falha.
- Custo
Uma instância de GPU bare metal fornece energia de CPU necessária para um custo maior. Avalie seus requisitos para escolher a forma de cálculo apropriada.
- Monitoramento e alertas
Configure o monitoramento e alertas na utilização da CPU e da memória de seus nós para que você possa ampliar ou reduzir a configuração conforme necessário.
