Configurar un entorno CAE mediante Altair HyperWorks con Oracle Cloud Guard
Libere a sus ingenieros de las restricciones de hardware locales para que puedan ejecutar simulaciones de ingeniería masiva en cualquier parte del mundo desde casi cualquier dispositivo.
HyperWorks Altair es un conjunto de software de ingeniería que se ejecuta en Oracle Cloud Infrastructure que permite a los ingenieros crear modelos y realizar análisis de ingeniería y diseñar la optimización de los diferentes requisitos de rendimiento. Oracle Cloud Infrastructure proporciona acceso directo a memoria remoto (RDMA)habilitado a redes de cluster y instancias de recursos informáticos de alto rendimiento (HPC) simples. Oracle Cloud Infrastructure ahora combina su instancia de HPC probada con una red de baja latencia que puede abarcar más de 20,000 núcleos.
Además, Altair proporciona un servicio gestionado denominado Altair HyperWorks Unlimited similar a esta implementación que ofrece:
-
Tiempos de diseño reducidos: las compañías pueden reducir los tiempos de diseño y llevar los productos al mercado más rápido accediendo al software y el hardware a petición.
-
No esperar: con esta solución a petición de Oracle y Altair, los ingenieros no tienen que esperar en colas de trabajos ni generar ciclos de adquisición de hardware de HPC largos.
-
Licencias flexibles: el modelo de licencia innovadora de Altair permite a los clientes utilizar licencias de software ilimitadas en el entorno de servicio gestionado.
Arquitectura
Esta arquitectura despliega un nodo principal, que ejecuta los clusters de nodos de cálculo de alto rendimiento (HPC) del programador, aprovisionamientos y deprovisiones, y procesa previamente algunos datos del cliente. El trabajo se realiza en el cluster de nodos de cálculo HPC y los resultados se almacenan en el almacenamiento de archivos.
Esta arquitectura se despliega con una red virtual en la nube privada (VCN). La red del cliente puede acceder al nodo principal solo a través de VPN o FastConnect de IPSec. Esta limitación proporciona acceso controlado al nodo principal. Sin embargo, para casos de uso específicos, los clientes pueden optar por desplegar esta arquitectura en una subred pública, donde el nodo principal también es accesible desde Internet público.
La arquitectura también utiliza Oracle Cloud Guard, que supervisa continuamente las configuraciones y actividades para identificar amenazas y actúa automáticamente para corregir problemas a nivel de compartimento.
La arquitectura utiliza una región con un dominio de disponibilidad y subredes regionales. Puede utilizar la misma arquitectura en una región con varios dominios de disponibilidad. Recomendamos que utilice subredes regionales para su despliegue, independientemente del número de dominios de disponibilidad.
Nota:
Si utiliza FastConnect, monte el almacenamiento de archivos en el nodo local para realizar una transferencia más rápida del juego de datos. Si utiliza una VPN de IPSec, transfiera primero los datos al almacenamiento de objetos (debido a variaciones de velocidad y conexión) y, a continuación, transfiéralo al almacenamiento de archivos.La arquitectura tiene los siguientes componentes:
- Región
Una región de Oracle Cloud Infrastructure es un área geográfica localizada que contiene uno o más centros de datos, denominados dominios de disponibilidad. Las regiones son independientes de otras regiones, y grandes distancias pueden separarlas (entre países o incluso continentes).
- Dominios de disponibilidad
Los dominios de disponibilidad son centros de datos independientes y independientes dentro de una región. Los recursos físicos de cada dominio de disponibilidad están aislados de los recursos de los demás dominios de disponibilidad, lo que proporciona tolerancia ante fallos. Los dominios de disponibilidad no comparten infraestructura, como alimentación o enfriamiento, o la red de dominio de disponibilidad interna. Por lo tanto, es poco probable que un fallo en un dominio de disponibilidad afecte al resto de dominios de disponibilidad de la región.
- Dominios de fallo
Un dominio de fallos es una agrupación de hardware e infraestructura dentro de un dominio de disponibilidad. Cada dominio de disponibilidad tiene tres dominios de fallos con energía y hardware independientes. Al distribuir recursos entre varios dominios de fallos, las aplicaciones pueden tolerar fallos físicos del servidor, mantenimiento del sistema y fallos de energía dentro de un dominio de fallos.
- Red virtual en la nube (VCN) y subredes
VCN es una red personalizable definida por software que se configura en una región de Oracle Cloud Infrastructure. Al igual que las redes tradicionales de centros de datos, las VCN le proporcionan un control completo sobre su entorno de red. VCN puede tener varios bloques CIDR no superpuestos que puede cambiar después de crear VCN. Puede segmentar VCN en subredes, que se pueden asignar a una región o a un dominio de disponibilidad. Cada subred consta de un rango contiguo de direcciones que no se superponen con las otras subredes de VCN. Puede cambiar el tamaño de una subred después de la creación. Una subred puede ser pública o privada.
- Nodo de Cabecera
Utilice un portal basado en web para conectarse al nodo principal y programar trabajos de HPC. La solicitud de trabajo se realiza mediante FastConnect o una VPN de IPSec al nodo principal. El nodo de cabecera también envía el juego de datos de cliente al almacenamiento de archivos y puede realizar un preprocesamiento de los datos.
El nodo principal aprovisiona clusters de nodos de HPC y cancela el aprovisionamiento de clusters de HPC cuando el trabajo finaliza.
- Nodo de cluster de HPC
El nodo principal aprovisiona y anula la provisión de estos nodos de cálculo, que son clusters compatibles con RDMAP. Procesan los datos almacenados en el almacenamiento de archivos y devuelven los resultados al almacenamiento de archivos.
- Protector de nube
Puede utilizar Oracle Cloud Guard para supervisar y mantener la seguridad de los recursos en la nube. Cloud Guard examina sus recursos para detectar deficiencias de seguridad relacionadas con la configuración y supervisa a los operadores y usuarios para realizar actividades de riesgo. Cuando se identifica cualquier problema de seguridad o riesgo, Cloud Guard recomienda acciones correctivas y le ayuda a realizar esas acciones, en función de las recetas de seguridad que pueda definir.
- Almacenamiento de archivos
El sistema de archivos del servicio de almacenamiento de archivos se monta en el nodo principal y en los nodos de cluster de HPC. Almacena el conjunto de datos de cliente y los resultados después de que los nodos de cluster de HPC procesen los datos.
- Lista de seguridad
Para cada subred, puede crear reglas de seguridad que especifiquen el origen, el destino y el tipo de tráfico que se debe permitir en la subred o fuera de ella.
Recomendaciones
Los requisitos pueden diferir de la arquitectura descrita aquí. Utilice las siguientes recomendaciones como punto de partida.
- VCN
Al crear una VCN, determine el número de bloques CIDR necesarios y el tamaño de cada bloque en función del número de recursos que planea asociar a subredes en VCN. Utilice bloques CIDR que se encuentran dentro del espacio de direcciones IP privadas estándar.
Seleccione bloques CIDR que no se superpongan con ninguna otra red (en Oracle Cloud Infrastructure, el centro de datos local u otro proveedor de nube) a la que desee configurar conexiones privadas.
Después de crear VCN, puede cambiar, agregar y eliminar sus bloques CIDR.
Cuando diseñe las subredes, tenga en cuenta los requisitos de flujo de tráfico y seguridad. Conecte todos los recursos dentro de un nivel o rol específico a la misma subred, que puede servir como límite de seguridad.
Utilice subredes regionales.
- Listas de seguridad
Utilice listas de seguridad para definir reglas de entrada y salida que se aplican a toda la subred.
- Cloud Guard
Clonar y personalizar las recetas por defecto proporcionadas por Oracle para crear recetas de detector y respuesta personalizadas. Estas recetas permiten especificar qué tipo de violaciones de seguridad generan una advertencia y qué acciones se pueden realizar en ellas. Por ejemplo, puede que desee detectar cubos de almacenamiento de objetos que tengan visibilidad definida en público.
Aplique Cloud Guard en el nivel de arrendamiento para cubrir el ámbito más amplio y reducir la carga administrativa de mantener varias configuraciones.
También puede utilizar la función Lista gestionada para aplicar determinadas configuraciones a los detectores.
- Nodo de Cabecera
Utilice la forma de VM.DenseIO2.24 Compute. Proporciona el almacenamiento NVME asociado localmente, que acelera el preprocesamiento de los datos.
El nodo principal sólo existe en compartimentos con Cloud Guard activado. Puede clonar y modificar la receta predeterminada para detector y respuesta para cualquier requisito específico. Se recomienda utilizar la receta por defecto como está.
- Nodo de cluster de HPC
Utilice la forma de BM.HPC2.36 Compute. Esta forma tiene 36 núcleos de dos procesadores 3.7GHz Intel Xeon Gold 6154, 384-GB RAM y 6.4-TB NVME local storage. Mediante el uso de potentes GPU NVIDIA disponibles en Oracle Cloud Infrastructure, puede posprocesar los resultados en la nube mediante la visualización remota.
El nodo de cluster HPC existe en compartimentos sólo con Cloud Guard activado. Puede clonar y modificar la receta predeterminada para detector y respuesta para cualquier requisito específico. Se recomienda utilizar la receta por defecto como está.
Consideraciones
Tenga en cuenta lo siguiente al desplegar esta arquitectura de referencia.
- Rendimiento
Para obtener el mejor rendimiento, elija la forma de cálculo correcta con el ancho de banda adecuado.
- Disponibilidad
Puede utilizar una opción de alta disponibilidad basada en los requisitos de despliegue y la región. Las opciones incluyen el uso de varios dominios de disponibilidad en una región y dominios de errores.
- Costo
Una instancia de GPU con hardware dedicado proporciona la energía de CPU necesaria para un costo más alto. Evalúe sus requisitos para elegir la forma de cálculo adecuada.
- Control y Alertas
Configure el control y las alertas sobre el uso de CPU y memoria de los nodos, para que pueda ampliar la forma hacia arriba o hacia abajo según sea necesario.
