Sun Cluster: Guía del desarrollador de los servicios de datos del sistema operativo Solaris

Supervisión de un recurso

Generalmente, se implementan los supervisores para que realicen análisis periódicos de fallos en los recursos, para detectar si funcionan correctamente. Si falla un análisis de fallos, el supervisor puede intentar un reinicio local o solicitar una operación de recuperación de fallos del grupo de recursos afectado, invocando las funciones scha_control() de RMAPI o scds_fm_action() de DSDL.

También se puede supervisar el rendimiento de un recurso y ajustar o realizar un informe del rendimiento. Escribir un supervisor de fallos específico del tipo de recurso es totalmente opcional. Incluso si decide no escribir un supervisor de fallos así, el tipo de recurso estará bajo la supervisión básica del clúster que realiza el propio Sun Cluster que detecta fallos del hardware del sistema, fallos graves del sistema operativo principal y los fallos de comunicación de un sistema en sus propias redes públicas.

Aunque RGM no invoca directamente al supervisor de recursos, permite el inicio automático de los supervisores de los recursos. Cuando se pone un recurso fuera de línea, RGM invoca el método Monitor_stop para detener el supervisor de recursos en los nodos locales antes de detener el recurso en sí. Cuando se pone un recurso en línea, RGM invoca el método Monitor_start después de que se haya iniciado el recurso en sí.

Las funciones scha_control() de RMAPI y scds_fm_action() de DSDL (que invoca scha_control()) permiten que los supervisores de recursos soliciten una operación de recuperación de fallos de un grupo de recursos a un nodo diferente. Dentro de las comprobaciones de validez, scha_control() invoca Monitor_check (si se ha definido), para determinar si el nodo solicitado es lo suficientemente fiable para controlar el grupo de recursos que contiene el recurso. Si Monitor_check informa que el nodo no es fiable, o que el método agota el tiempo de espera, RGM busca otro nodo para poder realizar la solicitud de recuperación de fallos. Si Monitor_check falla en todos los nodos, se cancela la recuperación de fallos.

El supervisor de recursos puede establecer las propiedades Status y Status_msg para reflejar la vista del supervisor del estado del recurso. Utilice la función scha_resource_setstatus() o la orden scha_resource_setstatus de RMAPI o la función scds_fm_action() de DSDL para establecer estas propiedades.


Nota –

Aunque Status y Status_msg son especialmente útiles para un supervisor de recursos, cualquier programa puede establecer estas propiedades.


Consulte Definición de un supervisor de fallos para ver un ejemplo de un supervisor de fallos implementado con RMAPI. Consulte Supervisor de fallos SUNW.xfnts para ver un ejemplo de un supervisor de fallos implementado con DSDL. Consulte Sun Cluster Data Services Planning and Administration Guide for Solaris OS para obtener información sobre los supervisores de fallos que se integran en los servicios de datos que suministra Sun.