Sun Cluster: Guía de conceptos para el SO Solaris

Preguntas más frecuentes sobre alta disponibilidad

Pregunta:

¿Qué es exactamente un sistema de alta disponibilidad?

Respuesta:

En el sistema Sun Cluster, se llama alta disponibilidad (HA) a la capacidad de un clúster para mantener en funcionamiento una aplicación. La aplicación sigue ejecutándose incluso cuando se produce un fallo que, normalmente, dejaría un sistema de servidor fuera de servicio.

Pregunta:

¿Cuál es el proceso por el que el clúster proporciona alta disponibilidad?

Respuesta:

A través de un proceso conocido como recuperación de fallos, la estructura del clúster proporciona un entorno de alta disponibilidad. Recuperación de fallos es una serie de pasos que realiza el clúster para migrar recursos de servicios de datos de un nodo fallido a otro operativo dentro del clúster.

Pregunta:

¿Cuál es la diferencia entre un servicio de datos a prueba de fallos y otro escalable?

Respuesta:

Hay dos tipos de servicios de datos de alta disponibilidad:

Un servicio de datos a prueba de fallos ejecuta una aplicación sólo en un nodo primario del clúster cada vez. Los demás nodos pueden ejecutar otras aplicaciones, pero cada una se ejecuta sólo en un nodo. Si un nodo principal falla, las aplicaciones que se ejecutan en el nodo que ha fallado se recuperan del error y continúan ejecutándose en otro nodo.

Un servicio escalable reparte una aplicación entre varios nodos para crear un servicio lógico único que aprovecha el número de nodos y procesadores de todo el clúster en el que se ejecutan.

Para cada aplicación un nodo aloja la interfaz física para el clúster. Este nodo se denomina interfaz global (GIF). En un clúster pueden existir varios nodos GIF. Cada uno de ellos aloja una o más interfaces lógicas que pueden usar los servicios escalables y que reciben el nombre de interfaces globales. Un nodo GIF aloja una interfaz global para todas las solicitudes hacia una aplicación en particular y las despacha a los distintos nodos en los que se esté ejecutando el servidor de la aplicación. Si el nodo GIF falla, la interfaz global se traslada a un nodo superviviente.

Si falla alguno de los nodos en los que se ejecuta la aplicación, ésta continúa ejecutándose en otros nodos con una leve pérdida de rendimiento. Este proceso continúa hasta que el nodo que ha fallado vuelve al clúster.