Planificación de alta disponibilidad para instancias informáticas

Oracle Cloud Infrastructure Compute proporciona instancias tanto con hardware dedicado como de máquina virtual (VM) que le permiten desplegar cualquier servidor de tamaño que necesite, desde una máquina virtual pequeña con un solo núcleo hasta un servidor de máquina virtual de gran tamaño o con hardware dedicado con muchos núcleos y una mayor cantidad de RAM. Estas opciones garantizan el rendimiento, la flexibilidad y el control para ejecutar las aplicaciones y cargas de trabajo más exigentes en la nube.

Para planificar la alta disponibilidad de sus instancias informáticas, las estrategias de diseño clave que debe tener en cuenta son:
  • Eliminar puntos únicos de fallo aprovechando adecuadamente el dominio de errores y los dominios de disponibilidad.
  • Mediante la supervisión, los pools de instancias y el equilibrador de carga.
  • Garantizar que el diseño protege tanto la disponibilidad de datos como la integridad de las instancias informáticas.
Este artículo describe estas estrategias.

Distribución de instancias en dominios de errores

Uno de los principios clave del diseño de soluciones de alta disponibilidad es evitar puntos de fallo únicos. Un principio de diseño clave sería distribuir sus instancias entre varios dominios de errores.

En un despliegue de dominio de disponibilidad único, al aprovechar adecuadamente los dominios de errores, puede aumentar la disponibilidad de las aplicaciones que se ejecutan en Oracle Cloud Infrastructure. La arquitectura de su aplicación determina si debe separar o agrupar instancias utilizando dominios de errores.
  • Escenario 1: arquitectura de aplicación altamente disponible

    En este escenario, tiene una aplicación altamente disponible; por ejemplo, dos servidores web y una base de datos agrupada. Aquí, puede agrupar un servidor web y un nodo de base de datos en un dominio de errores y la otra mitad de cada par en otro dominio de errores. Esta arquitectura garantiza que un error de cualquier dominio de errores no resulte en una interrupción de su aplicación.

  • Situación 2: Servidor web único y arquitectura de instancia de base de datos

    En este escenario, la arquitectura de su aplicación no está altamente disponible; tiene, por ejemplo, un servidor web y una instancia de base de datos. Aquí, tanto el servidor web como la instancia de la base de datos deben ubicarse en el mismo dominio de errores. Esta arquitectura garantiza que su aplicación se vea afectada solo por el error de ese único dominio de errores.

Distribución de instancias en distintos dominios de disponibilidad

Otro enfoque de la alta disponibilidad es desplegar instancias informáticas que realizan las mismas tareas en varios dominios de disponibilidad. Este diseño elimina un único punto de fallo al introducir redundancia en los centros de datos.

En un despliegue de varios dominios de disponibilidad, puede separar grupos de instancias por dominio de disponibilidad. De esta forma, se protege su aplicación frente a fallos de nivel de centro de datos, como interrupciones de alimentación, fallos de infraestructura física o eventos de mantenimiento planificados.

Cuando las instancias se distribuyen entre dominios de disponibilidad o dominios de errores, a menudo se utiliza un equilibrador de carga para mejorar el uso de recursos, facilitar la ampliación y garantizar una alta disponibilidad. Soporta el direccionamiento de solicitudes entrantes a varios juegos de backends o grupos de instancias informáticas, equilibrando el tráfico de red entre ellos.

En el siguiente diagrama se muestran las máquinas virtuales de servidor web desplegadas en dos dominios de disponibilidad para implantar la redundancia, junto con un equilibrador de carga:



Nota:

La arquitectura muestra varios dominios de disponibilidad (AD). En el caso de una región con un solo dominio de disponibilidad, ajuste la arquitectura para distribuir sus recursos entre los dominios de errores dentro del dominio de disponibilidad.
En función de los requisitos del sistema o la aplicación, puede implementar esta redundancia arquitectónica en modo activo o en espera:
  • En el modo en espera, cuando falla el componente principal, toma el control del componente en espera. El modo en espera se utiliza normalmente para aplicaciones que necesitan mantener sus estados.
  • En el modo activo, no se designa ningún componente como principal o en espera; todos los componentes participan activamente en la realización de las mismas tareas. Cuando uno de los componentes falla, las tareas relacionadas se distribuyen simplemente a otro componente. El modo activo se suele utilizar para aplicaciones sin estado.

Garantice una alta disponibilidad e integridad de los datos

Para una arquitectura de alta disponibilidad, siempre asegúrese de que su diseño protege tanto la disponibilidad como la integridad de los datos de las instancias informáticas. Para proteger la disponibilidad de los datos de la instancia informática, puede replicar o realizar una copia de seguridad de los datos en otra ubicación.

  • Resumen de volumen en bloque

    El servicio Oracle Cloud Infrastructure Block Volume le permite aprovisionar y gestionar volúmenes de almacenamiento en bloque de forma dinámica. Puede crear, asociar, conectar y mover volúmenes, así como cambiar el rendimiento de estos, según sea necesario, para cumplir con los requisitos de almacenamiento, rendimiento y aplicación. Después de asociar y conectar un volumen a una instancia, puede utilizar el volumen como si se tratara de una unidad de disco duro normal. También puede desconectar un volumen y asociarlo a otra instancia sin perder datos.

  • Duración del volumen

    El servicio Oracle Cloud Infrastructure Block Volume ofrece un alto nivel de durabilidad de los datos en comparación con las unidades asociadas estándar. Todos los volúmenes se replican automáticamente, lo que ayuda a protegerse contra la pérdida de datos. Se almacenan varias copias de datos de forma redundante en un gran número de servidores de almacenamiento, equipados con mecanismos de reparación integrados. Para el objetivo de nivel de servicio, el servicio Block Volume está diseñado para proporcionar una durabilidad anual del 99,99 % para volúmenes en bloque y volúmenes de inicio. Sin embargo, recomendamos realizar copias de seguridad habituales para protegerse frente a un posible fallo de un dominio de disponibilidad.

  • Replicación de volumen

    El servicio Block Volume proporciona la capacidad de realizar una replicación asíncrona automática y continua de los volúmenes en bloque y de inicio en otras regiones o dominios de disponibilidad de la misma región. La replicación entre dominios de disponibilidad en la misma región solo está soportada para regiones con más de un dominio de disponibilidad. Para determinar qué regiones contienen más de un dominio de disponibilidad, consulte el campo Dominios de disponibilidad de la tabla que muestra las regiones en Acerca de las regiones y los dominios de disponibilidad. Esta función soporta escenarios de recuperación ante desastres, migración y expansión del negocio sin la necesidad de contar con copias de seguridad del volumen. Para obtener más información, consulte "Replicación de un volumen", al que puede acceder desde el tema Explorar más, en otro lugar de este manual.

Acerca de las copias de seguridad de volumen en bloque

La función de copias de seguridad del servicio Oracle Cloud Infrastructure Block Volume permite realizar una instantánea puntual de los datos en un volumen en bloque. Puede realizar una copia de seguridad de un volumen al asociarlo a una instancia o mientras está asociado. A continuación, estas copias de seguridad se pueden restaurar a volúmenes nuevos inmediatamente después de una copia de seguridad o más tarde si así lo elige.

Las copias de seguridad se cifran y almacenan en OCI Object Storage, y se pueden restaurar como volúmenes nuevos en cualquier dominio de disponibilidad dentro de la misma región en la que se almacenan. Esta función proporciona una copia de reserva de un volumen y permite completar correctamente la recuperación ante desastres en la misma región.

Puede iniciar una copia de seguridad de dos formas: manualmente o mediante la asignación de una política que defina un programa de copia de seguridad definido. Para obtener más información sobre los volúmenes de bloack, consulte Visión general de las copias de seguridad de volúmenes en bloque, a las que puede acceder desde el tema Explorar más en otro lugar de este manual. https://docs.oracle.com/en-us/iaas/Content/Block/Concepts/blockvolumebackups.htm

Uso de la replicación síncrona o asíncrona

Puede utilizar la replicación síncrona o asíncrona para proteger los datos si la instancia informática falla:

  • Los dominios de disponibilidad de una región están interconectados por una red de alto rendimiento que admite la replicación síncrona. Si la aplicación necesita un failover instantáneo y no puede tolerar la pérdida de datos, utilice la replicación síncrona. Debido a sus requisitos de rendimiento de red, la replicación síncrona se suele utilizar en una región.
  • Para las aplicaciones que necesitan la protección de la disponibilidad de datos entre regiones, emplee la replicación asíncrona.

Las copias de seguridad tradicionales son otra forma de proteger sus datos. Para obtener la máxima durabilidad de los datos, no almacene sus copias de seguridad en el mismo dominio de disponibilidad que su instancia informática original. Debe utilizar Oracle Cloud Infrastructure Object Storage para realizar una copia de seguridad de los datos de la instancia informática. Para las instancias informáticas con unidades NVMe locales, una matriz RAID protegida es la mejor manera de protegerse contra un fallo de dispositivo NVMe.

Para obtener más información, consulte "Protección de datos en dispositivos NVMe", a los que puede acceder desde el tema Explorar más en otro lugar de este manual.