Despliegue de un cluster de almacenamiento de alto rendimiento mediante la escala de espectro IBM

IBM Spectrum Scale es un sistema de archivos de cluster que proporciona acceso simultáneo a uno o más sistemas de archivos desde varios nodos. Los nodos pueden estar conectados a SAN, conectados a red, una mezcla de SAN conectados y conectados a red o en una configuración de cluster de nada compartido. Spectrum Scale permite el acceso de alto rendimiento a un conjunto común de datos para soportar una solución de ampliación o para proporcionar una plataforma de alta disponibilidad.

Arquitectura

Un caso de uso para Spectrum Scale es el despliegue de aplicaciones SAS Grid que necesitan un subsistema de E/S robusto. En esta arquitectura de referencia se describe el despliegue de una solución de alto rendimiento de E/S mediante un sistema de archivos IBM Spectrum en Oracle Cloud Infrastructure.

Esta arquitectura de referencia utiliza una región con un dominio de disponibilidad y subredes regionales. Puede utilizar la misma arquitectura de referencia en una región con varios dominios de disponibilidad. Recomendamos que utilice subredes regionales para su despliegue, independientemente del número de dominios de disponibilidad.

El siguiente diagrama ilustra esta arquitectura de referencia.

Descripción de specter-oci.png a continuación
Descripción de la ilustración specter-oci.png

La arquitectura del sistema de archivos Spectrum Scale tiene los siguientes componentes:

  • Nodo CES

    Los nodos de Cluster Export Services (CES) pueden servir funciones de protocolo integradas. Estos nodos proporcionan acceso SMB, NFS u objeto a los datos del sistema de archivos IBM Spectrum Scale. Este nodo es opcional. Recomendamos utilizar una forma VM.Standard2.8 o superior (al menos dos VNIC) para obtener un rendimiento superior.

  • Nodo GUI de MGMT

    Este nodo proporciona una interfaz GUI para que los usuarios supervisen su sistema de archivos Spectrum Scale. Este nodo es opcional. Recomendamos utilizar una forma VM.Standard2.16 o superior para proporcionar suficiente OCPU y memoria.

  • Nodo de cliente

    Estos nodos utilizan el sistema de archivos Spectrum Scale. Los servidores Network Shared Disk (NSD) les proporcionan datos de disco.

  • Servidor NSD

    Estos servidores utilizan el protocolo NSD para servir datos a nodos de cliente en un modelo de protocolo cliente-servidor. Los servidores NSD proporcionan acceso al almacenamiento visible en los servidores como dispositivos de bloques locales.

  • Almacenamiento de objetos

    Oracle Cloud Infrastructure Object Storage es un servicio de almacenamiento a escala de Internet duradero y escalable.

  • Red virtual en la nube (VCN) y subredes

    VCN es una red definida por software que se configura en una región de Oracle Cloud Infrastructure. Las VCN se pueden segmentar en subredes, que pueden ser específicas de una región o de un dominio de disponibilidad. Las subredes específicas de cada región y de cada dominio de disponibilidad pueden coexistir en la misma VCN. Una subred puede ser pública o privada.

  • Listas de seguridad

    Para cada subred, puede crear reglas de seguridad que especifiquen el origen, destino y tipo de tráfico que se debe permitir dentro y fuera de la subred.

  • Dominios de disponibilidad

    Los dominios de disponibilidad son centros de datos independientes e independientes dentro de una región. Los recursos físicos de cada dominio de disponibilidad están aislados de los recursos de los demás dominios de disponibilidad, lo que proporciona tolerancia a fallos. Los dominios de disponibilidad no comparten infraestructura, como energía o refrigeración, o la red de dominio de disponibilidad interna. Por lo tanto, es poco probable que un fallo en un dominio de disponibilidad afecte a los otros dominios de disponibilidad de la región.

Recomendaciones

Sus requisitos pueden diferir de la arquitectura descrita aquí. Utilice las siguientes recomendaciones como punto de partida.

  • Forma informática, bastión host

    Se utiliza un host de bastión para acceder a cualquier nodo de la subred privada. Utilice la forma VM.Standard.E2.1 o VM.Standard.E2.2.

  • Forma informática, nodo CES

    Utilice una forma VM.Standard2.8 o superior (al menos dos VNIC) para obtener un rendimiento superior.

  • Forma informática, nodo GUI de MGMT

    Utilice una forma VM.Standard2.16 o superior para proporcionar suficiente OCPU y memoria.

  • Forma informática, nodo de cliente

    El usuario puede tener varios nodos de cliente. Empieza con una forma VM.Standard2.24 y sube o baja según sea necesario.

  • Forma informática, servidor NSD

    Los servidores NSD requieren un alto rendimiento y potencia de procesamiento. Utilice una forma BM.Standard2.52 o BM.Standard.E2.64. Además, utilice al menos dos nodos del servidor NSD.

  • VCN

    Al crear VCN, determine cuántas direcciones IP necesitan sus recursos en la nube en cada subred. Mediante la notación Classless Inter-Domain Routing (CIDR), especifique una máscara de subred y un rango de direcciones de red lo suficientemente grande como para las direcciones IP necesarias. Utilice un rango de direcciones que esté dentro del espacio de direcciones IP privadas estándar.

    Seleccione un rango de direcciones que no se superponga con la red local, de modo que pueda configurar una conexión entre VCN y la red local, si es necesario.

    Después de crear un VCN, no puede cambiar su rango de direcciones.

    Cuando diseñe las subredes, tenga en cuenta sus requisitos de flujo de tráfico y seguridad. Conecte todos los recursos dentro de un nivel o rol específico a la misma subred, que puede servir como límite de seguridad.

    Utilice subredes regionales.

  • Listas de seguridad

    Utilice listas de seguridad para definir reglas de entrada y salida que se aplican a toda la subred. Por ejemplo, esta arquitectura permite ICMP internamente para toda la subred privada.

Consideraciones

  • Rendimiento

    Para obtener el mejor rendimiento, elija la forma informática correcta con el ancho de banda adecuado.

  • Disponibilidad

    Considere la posibilidad de utilizar una opción de alta disponibilidad basada en el requisito de despliegue.

  • Costo

    Las instancias de hardware dedicado proporcionan un mayor rendimiento en las operaciones de E/S para un mayor costo. Evalúe sus requisitos para elegir la forma informática adecuada.

  • Supervisión y alertas

    Configure monitoreos y alertas sobre el uso de CPU y memoria para sus nodos para escalar la forma hacia arriba o hacia abajo según sea necesario.

Desplegar

El código Terraform para desplegar esta arquitectura de referencia está disponible en GitHub.

  1. Vaya a GitHub.
  2. Clone o descargue el repositorio en su computadora local.
  3. Siga las instrucciones del documento README.