Sun Cluster: Guía del servicio de datos para Sun Java System Web Server para el SO Solaris

Delimitación del supervisor de fallos de Sun Cluster HA para Sun Java System Web Server

El supervisor de fallos de Sun Cluster HA para Sun Java System Web Server está contenido en el recurso que representa Sun Java System Web Server. Este recurso se crea cuando registra y configura Sun Cluster HA para Sun Java System Web Server. Para obtener más información, consulte Registro y configuración de Sun Cluster HA para Sun Java System Web Server.

Las propiedades del sistema y de extensión de este recurso controlan el comportamiento del supervisor de fallos. Los valores predeterminados de estas propiedades determinan el comportamiento predeterminado del supervisor de fallos. El comportamiento predeterminado debería ser adecuado para la mayoría de las instalaciones de Sun Cluster. Por tanto, deberá ajustar el supervisor de fallos de Sun Cluster HA para Sun Java System Web Server sólo si necesita modificar este comportamiento predeterminado.

Para obtener más información, consulte las siguientes secciones.

Operaciones del supervisor de fallos durante un análisis

El análisis de Sun Cluster HA para Sun Java System Web Server envía una solicitud al servidor para consultar su estado. Antes de que se realice efectivamente la consulta al servidor, se realiza una comprobación para confirmar que los recursos de red están configurados para este recurso de servidor Web. Si no se configura ningún recurso de red, se registra un mensaje de error (No network resources found for resource) y el análisis finaliza con un fallo.

El análisis debe dirigirse a las dos siguientes configuraciones de Sun Java System Web Server.

Si el servidor Web está en modo seguro y el análisis no puede obtener los puertos seguros del archivo de configuración, se registra un mensaje de error (Unable to parse configuration file) y el análisis finaliza con un fallo. Los análisis de instancias seguras y no seguras incluyen pasos comunes.

El valor de la propiedad de recurso Network_resources_used del recurso Sun Java System Web Server determina el conjunto de direcciones IP que utiliza el servidor Web. La configuración de la propiedad de recurso Port_list determina la lista de números de puerto que utiliza Sun Java System Web Server. El supervisor de fallos asume que el servidor Web está recibiendo en todas las combinaciones de IP y puerto. Si personaliza su configuración de servidor Web para que reciba en distintos números de puerto (además del puerto 80), asegúrese de que el archivo de configuración resultante (magnus.conf) contenga todas las combinaciones posibles de puertos y direcciones IP. El supervisor de fallos intenta analizar todas esas combinaciones y puede fallar si el servidor Web no recibe en una combinación determinada de puerto y dirección IP.

Si el análisis no se puede conectar al servidor Web utilizando una combinación determinada de puerto y dirección IP, se producirá un fallo completo. El análisis registra el fallo y realiza la acción adecuada.

Si el análisis se conecta satisfactoriamente, comprueba si el servidor Web se ejecuta en modo seguro. Si es así, se desconecta y devuelve un estado satisfactorio. No se realizan nuevas comprobaciones de Sun Java System Web Server seguro.

Sin embargo, si el servidor Web está funcionando en modo no seguro, el análisis envía una solicitud HTTP 1.0 HEAD al servidor Web y espera la respuesta. La solicitud puede no ser satisfactoria por diversos motivos, incluidos un tráfico de red intenso, una fuerte carga del sistema o una configuración errónea.

La configuración errónea se puede producir cuando el servidor Web no está configurado para recibir en todas las combinaciones de puerto y dirección IP que se están analizando. El servidor Web debería dar servicio a todos los puertos de cada dirección IP especificada para el recurso.

Las configuraciones erróneas también pueden producirse si las propiedades de recurso Network_resources_used y Port_list no se han configurado correctamente al crear el recurso.

Si la respuesta a la consulta no se recibe en el límite de tiempo del recurso Probe_timeout, el análisis considera que es un fallo de Sun Cluster HA para Sun Java System Web Server. El fallo se registra en el historial de análisis.

Un fallo de análisis puede ser parcial o total. Los siguientes fallos se consideran totales.

El supervisor acumula dos fallos parciales como estos en el intervalo de la propiedad de recurso Retry_interval y los cuenta como uno solo.

Los siguientes fallos se consideran parciales.

El análisis se conecta al servidor Sun Java System Web Server y realiza una comprobación de HTTP 1.1 GET enviando una solicitud HTTP a cada uno de los URI de Monitor_Uri_List. Si el código de retorno del servidor es HTTP 500 (Internal Server Error) o si la conexión falla, el análisis entrará en acción.

El resultado de las solicitudes de HTTP puede ser no satisfactorio o satisfactorio. Si todas las solicitudes reciben satisfactoriamente una respuesta del servidor Sun Java System Web Server, el análisis retorna y realiza el siguiente ciclo de análisis y reposo.

Un tráfico pesado en la red, una carga elevada del sistema o una configuración errónea pueden hacer que la operación HTTP GET falle. Una configuración errónea de la propiedad Monitor_Uri_List puede producir un fallo si un URI en Monitor_Uri_List incluye un puerto o nombre de host incorrecto. Por ejemplo, si la instancia del servidor Web recibe en un host lógico schost-1 y el URI se especificó como http://schost-2/servlet/monitor, el análisis intentará contactar con schost-2 para solicitar /servlet/monitor.

Basado en el historial de fallos, un fallo puede provocar un reinicio local o una recuperación de fallos del servicio de datos. Esta acción se describe con más detalle en Tuning Fault Monitors for Sun Cluster Data Services de Sun Cluster Data Services Planning and Administration Guide for Solaris OS.