Despliegue de la dinámica molecular y aplicaciones GROMACS
Despliegue la dinámica molecular y las aplicaciones GROMACS mediante cualquiera de las opciones de marco computacional, desde formas de GPU con hardware dedicado a máquinas virtuales disponibles en Oracle Cloud Infrastructure (OCI).
GROMACS es un software de dinámica molecular que simula los movimientos de átomos en biomoléculas bajo un conjunto predefinido de condiciones. Identifica el comportamiento de estas biomoléculas cuando están expuestas a cambios de temperatura, presión y otros insumos que imitan las condiciones reales encontradas en un organismo vivo. GROMACS puede establecer patrones de plegado de proteínas, unión a proteínas y transporte de membranas celulares, lo que lo convierte en una aplicación útil para la investigación y descubrimiento de fármacos.
GROMACS tiene las siguientes características clave:
- Está diseñado principalmente para moléculas bioquímicas como proteínas, lípidos y ácidos nucleicos.
- Proporciona un alto rendimiento con muchas optimizaciones algorítmicas.
- Más a menudo se escribe en C (compilador se transforma en instrucciones de máquina SIMD) y utiliza una interfaz simple con opciones de línea de comandos para archivos de entrada y salida.
- Es fácil de usar con topologías, archivos de parámetros escritos en formato de texto claro, comprobación de consistencia y mensajes de error claros.
- Puede ejecutarse en paralelo, utilizando el protocolo de comunicación MPI estándar o a través de nuestra propia biblioteca MPI Thread para estaciones de trabajo de nodo único.
- Incluye un constructor de topología totalmente automatizado.
- Es software libre, disponible en GNU Lesser General Public License (LGPL), versión 2.1.
Arquitectura
Puede utilizar esta arquitectura de referencia para varias aplicaciones relacionadas con el aprendizaje profundo y la computación científica.
Las cargas de trabajo de aprendizaje profundo y computación científica requieren marcos computacionales especializados. Oracle Cloud Infrastructure (OCI) ofrece una amplia variedad de opciones, desde formas de GPU con hardware dedicado a máquinas virtuales (VM), para manejar las cargas de trabajo más exigentes. NVIDIA GPU Cloud (NGC) es una de las opciones disponibles en Oracle Cloud Infrastructure.
En esta arquitectura de referencia simple, se despliega un nodo GPU con almacenamiento de bloques en VCN con subred pública e gateway de Internet. El almacenamiento de bloques almacena las aplicaciones.
El siguiente diagrama ilustra esta arquitectura de referencia.
La arquitectura tiene los siguientes componentes:
- Región
Una región de Oracle Cloud Infrastructure es un área geográfica localizada que contiene uno o más centros de datos, denominados dominios de disponibilidad. Las regiones son independientes de otras regiones, y grandes distancias pueden separarlas (entre países o incluso continentes).
- Dominios de disponibilidad
Los dominios de disponibilidad son centros de datos independientes e independientes dentro de una región. Los recursos físicos de cada dominio de disponibilidad están aislados de los recursos de los otros dominios de disponibilidad, lo que proporciona tolerancia a fallos. Los dominios de disponibilidad no comparten infraestructura, como energía o refrigeración, o la red de dominio de disponibilidad interna. Por lo tanto, es poco probable que un fallo en un dominio de disponibilidad afecte a los otros dominios de disponibilidad de la región.
- Arrendamiento
Un arrendamiento es una partición segura y aislada que Oracle configura en Oracle Cloud al registrarse en Oracle Cloud Infrastructure. Puede crear, organizar y administrar sus recursos en Oracle Cloud dentro de su arrendamiento.
- Compartimento
Los compartimentos son particiones lógicas interregionales dentro de un arrendamiento de Oracle Cloud Infrastructure. Utilice compartimentos para organizar los recursos en Oracle Cloud, controlar el acceso a los recursos y definir cuotas de uso. Para controlar el acceso a los recursos de un compartimento determinado, defina políticas que especifiquen quién puede acceder a los recursos y qué acciones pueden realizar.
- Cloud Guard
Puede utilizar Oracle Cloud Guard para supervisar y mantener la seguridad de sus recursos en Oracle Cloud Infrastructure. Cloud Guard utiliza recetas de detectores que puede definir para examinar sus recursos para detectar deficiencias de seguridad y para supervisar a los operadores y usuarios para realizar actividades de riesgo. Cuando se detecta cualquier actividad incorrecta o insegura, Cloud Guard recomienda acciones correctivas y ayuda a realizar esas acciones, en función de las recetas de respuesta que pueda definir.
- Red virtual en la nube (VCN) y subredes
VCN es una red personalizable definida por software que se configura en una región de Oracle Cloud Infrastructure. Al igual que las redes tradicionales de centros de datos, las VCN le proporcionan un control completo sobre su entorno de red. VCN puede tener varios bloques CIDR no superpuestos que puede cambiar después de crear VCN. Puede segmentar VCN en subredes, que se pueden asignar a una región o a un dominio de disponibilidad. Cada subred se compone de un rango contiguo de direcciones que no se solapan con las otras subredes de VCN. Puede cambiar el tamaño de una subred después de la creación. Una subred puede ser pública o privada.
- Gateway de Internet
El gateway de Internet permite el tráfico entre las subredes públicas de una VCN y la Internet pública.
- Tabla de rutas
Las tablas de rutas virtuales contienen reglas para enrutar el tráfico de subredes a destinos fuera de VCN, normalmente a través de gateways.
- Lista de seguridad
Para cada subred, puede crear reglas de seguridad que especifiquen el origen, destino y tipo de tráfico que se debe permitir dentro y fuera de la subred.
- Computar
El servicio Oracle Cloud Infrastructure Compute permite aprovisionar y gestionar hosts de recursos informáticos en la nube. Puede iniciar instancias de recursos informáticos con formas que cumplan los requisitos de recursos (CPU, memoria, ancho de banda de red y almacenamiento). Después de crear una instancia de recursos informáticos, puede acceder a ella de forma segura, reiniciarla, anexar y separar volúmenes y terminarla cuando no la necesite.
- GPU de hardware dedicado
Utilice una forma GPU de hardware dedicado para análisis acelerados por hardware y otros cálculos.
- Volumen en bloque
Con volúmenes de almacenamiento en bloque, puede crear, asociar, conectar y mover volúmenes de almacenamiento y cambiar el rendimiento del volumen para satisfacer los requisitos de almacenamiento, rendimiento y aplicación. Después de conectar y conectar un volumen a una instancia, puede utilizar el volumen como un disco duro normal. También puede desconectar un volumen y anexarlo a otra instancia sin perder datos.
Recomendaciones
Utilice las siguientes recomendaciones como punto de partida para desplegar aplicaciones de dinámica molecular mediante cualquiera de las opciones de marco computacional de Oracle Cloud Infrastructure.
Sus requisitos pueden diferir de la arquitectura descrita aquí.
- VCN
Al crear un VCN, determine el número de bloques CIDR necesarios y el tamaño de cada bloque en función del número de recursos que tiene previsto asociar a subredes en VCN. Utilice bloques CIDR que estén dentro del espacio de direcciones IP privadas estándar.
Seleccione bloques CIDR que no se superpongan con ninguna otra red (en Oracle Cloud Infrastructure, el centro de datos local u otro proveedor de nube) a la que desea configurar conexiones privadas.
Después de crear un VCN, puede cambiar, agregar y eliminar sus bloques CIDR.
Cuando diseñe las subredes, tenga en cuenta sus requisitos de flujo de tráfico y seguridad. Conecte todos los recursos dentro de un nivel o rol específico a la misma subred, que puede servir como límite de seguridad.
Utilice subredes regionales.
- Listas de seguridad
Utilice las listas de seguridad para definir las reglas de entrada y salida que se aplican a toda la subred.
- Cloud Guard
Clonar y personalizar las recetas por defecto proporcionadas por Oracle para crear recetas de detector y respuesta personalizadas. Estas recetas permiten especificar qué tipo de violaciones de seguridad generan una advertencia y qué acciones se pueden realizar en ellas. Por ejemplo, puede que desee detectar cubos de almacenamiento de objetos que tengan visibilidad definida en público.
Aplique Cloud Guard en el nivel de arrendamiento para cubrir el alcance más amplio y reducir la carga administrativa de mantener múltiples configuraciones.
También puede utilizar la función Lista gestionada para aplicar determinadas configuraciones a los detectores.
- GPU de hardware desnudo
Utilice las formas de hardware dedicado BM.GPU2.2 o BM.GPU3.8 para obtener el mejor rendimiento.
Consideraciones
Al implementar aplicaciones de dinámica molecular, tenga en cuenta lo siguiente:
- Rendimiento
Para obtener el mejor rendimiento, elija la forma de cálculo correcta con el ancho de banda adecuado.
- Disponibilidad
Considere la posibilidad de utilizar una opción de alta disponibilidad en función de los requisitos de despliegue y la región. Las opciones incluyen el uso de varios dominios de disponibilidad en una región y el uso de dominios con fallos.
- Costo
Una instancia HPC de hardware dedicado proporciona la potencia de CPU necesaria para un costo más alto. Evalúe sus requisitos para elegir la forma informática adecuada.
- Supervisión y Alertas
Configure la supervisión y las alertas sobre el uso de CPU y memoria para los nodos, de modo que pueda escalar la forma hacia arriba o hacia abajo según sea necesario.
Desplegar
El código Terraform para esta arquitectura de referencia está disponible en GitHub. Puede extraer el código a Oracle Cloud Infrastructure Resource Manager con un solo clic, crear la pila y desplegarlo. También puede descargar el código de GitHub en el equipo, personalizar el código y desplegar la arquitectura mediante la CLI de Terraform.
- Desplegar mediante la pila de ejemplo en Oracle Cloud Infrastructure Resource Manager:
- Haga clic en
Si aún no ha iniciado sesión, introduzca las credenciales de arrendamiento y usuario.
- Revise y acepte los términos y condiciones.
- Seleccione la región en la que desea desplegar la pila.
- Siga las instrucciones y peticiones de datos en pantalla para crear la pila.
- Después de crear la pila, haga clic en Acciones de Terraform y seleccione Plan.
- Espere a que se complete el trabajo y revise el plan.
Para realizar cualquier cambio, vuelva a la página Detalles de Pila, haga clic en Editar Pila y realice los cambios necesarios. A continuación, vuelva a ejecutar la acción Plan.
- Si no son necesarios otros cambios, vuelva a la página Detalles de Pila, haga clic en Acciones de Terraform y seleccione Aplicar.
- Haga clic en
- Desplegar mediante el código Terraform en GitHub:
- Vaya a GitHub.
- Clone o descargue el repositorio en su computadora local.
- Siga las instrucciones del documento
README
.
Explorar más
Obtenga más información sobre las características de esta arquitectura.
-
Para obtener más información, consulte la documentación GROMACS.