Sun Cluster: Guía del desarrollador de los servicios de datos del sistema operativo Solaris

Supervisión de un recurso

Generalmente, se implementan los supervisores para que realicen análisis periódicos de fallos en los recursos, para detectar si funcionan correctamente. Si falla un análisis de fallos, el supervisor puede intentar reiniciar de forma local el grupo de recursos afectado o realizar una recuperación ante fallos. El supervisor solicita la recuperación ante fallos mediante una llamada a la función scha_control() de RMAPI o la función scds_fm_action() de DSDL.

También se puede supervisar el redimiento de un recurso, y ajustarlo o informar sobre él. La escritura de un supervisor de fallos específico del tipo de recurso es opcional. Incluso si decide no escribir un supervisor de fallos así, el tipo de recurso estará bajo la supervisión básica del clúster que realiza el propio Sun Cluster que detecta fallos del hardware del host, fallos graves del sistema operativo principal y los fallos de comunicación de un host en sus propias redes públicas.

Aunque RGM no llama directamente a un supervisor de recursos, sí proporciona funciones para iniciar automáticamente supervisores de recursos. Cuando se pone un recurso fuera de línea, RGM invoca el método Monitor_stop para detener el supervisor de recursos en los nodos locales antes de detener el recurso en sí. Al poner en línea un recurso, RGM llama al método Monitor_start una vez iniciado el recurso.

La función scha_control() de RMAPI y la función scds_fm_action () de DSDL (que llama a scha_control()) permiten a los supervisores de recursos solicitar una operación de recuperación ante fallos del grupo de recursos en un nodo diferente. Al igual que una de sus comprobaciones de integridad, scha_control() llama a Monitor_check (si se ha definido) para determinar si el nodo solicitado es lo suficientemente fiable para controlar el grupo de recursos que contiene el recurso. Si Monitor_check informa de que el nodo no es fiable o de que se ha agotado el tiempo de espera del método, RGM busca un nodo diferente al que enviar la solicitud de recuperación ante fallos. Si Monitor_check falla en todos los nodos, se cancela la recuperación ante fallos.

El supervisor de recursos puede establecer las propiedades Status y Status_msg para reflejar el estado el recurso proporcionado por el supervisor. Utilice la función scha_resource_setstatus() de RMAPI, el comando scha_resource_setstatus o la función scds_fm_action() de DSDL para establecer estas propiedades.


Nota –

Aunque las propiedades Status y Status_msg son específicas del supervisor de recursos, cualquier programa puede establecerlas.


Consulte Definición de un supervisor de fallos para obtener un ejemplo de un supervisor de fallos implementado con RMAPI. Consulte Supervisor de fallos SUNW.xfnts para obtener un ejemplo de un supervisor de fallos implementado con DSDL. Consulte Sun Cluster Data Services Planning and Administration Guide for Solaris OS para obtener información sobre los supervisores de fallos que se integran en los servicios de datos que suministra Sun.