Sun Cluster: Guía del servicio de datos para Sun Java System Web Server para SO Solaris

Supervisión de fallos de Sun Cluster HA for Sun Java System Web Server

El análisis de Sun Cluster HA for Sun Java System Web Server utiliza una solicitud al servidor para consultar el estado de ese servidor. Antes de que se realice efectivamente la consulta al servidor, se realiza una comprobación para confirmar que los recursos de red están configurados para este recurso de servidor Web. Si no se configura ningún recurso de red, se registra un mensaje de error (No network resources found for resource) y el análisis finaliza con un fallo.

El análisis debe dirigirse a las dos siguientes configuraciones de Sun Java System Web Server.

Si el servidor Web está en modo seguro y el análisis no puede obtener los puertos seguros del archivo de configuración, se registra un mensaje de error (Unable to parse configuration file) y el análisis finaliza con un fallo. Los análisis de instancias seguras y no seguras incluyen pasos comunes.

El análisis emplea el valor de tiempo de espera que especifica la propiedad de recurso Probe_timeout para limitar el tiempo que se invierte en intentar realizar un análisis satisfactorio de Sun Java System Web Server. Consulte “Standard Properties” in Sun Cluster Data Services Planning and Administration Guide for Solaris OS si desea obtener información sobre la propiedad de este recurso.

El valor de la propiedad de recurso Network_resources_used del recurso Sun Java System Web Server determina el conjunto de direcciones IP que utiliza el servidor Web. El valor de la propiedad de recurso Port_list determina la lista de números de puerto que utiliza Sun Java System Web Server. El supervisor de fallos asume que el servidor Web está recibiendo en todas las combinaciones de IP y puerto. Si personaliza su configuración de servidor Web para que reciba en distintos números de puerto (además del puerto 80), asegúrese de que el archivo de configuración resultante (magnus.conf) contenga todas las combinaciones posibles de puertos y direcciones IP. El supervisor de fallos intenta analizar todas esas combinaciones y puede fallar si el servidor Web no recibe en una combinación determinada de puerto y dirección IP.

El análisis realiza los pasos siguientes.

  1. El análisis utiliza la combinación de dirección IP y puerto especificada para conectarse al servidor Web. Si la conexión no es satisfactoria, el análisis se considera totalmente insatisfactorio. El análisis registra el fallo y toma las medidas pertinentes.

  2. Si el análisis se conecta satisfactoriamente, comprueba si el servidor Web se ejecuta en modo seguro. Si es así, se desconecta y devuelve un estado satisfactorio. No se realizan nuevas comprobaciones de Sun Java System Web Server seguro.

    Sin embargo, si el servidor Web está funcionando en modo no seguro, el análisis envía una solicitud HTTP 1.0 HEAD al servidor Web y espera la respuesta. La solicitud puede no ser satisfactoria por diversos motivos, incluidos un tráfico de red intenso, una fuerte carga del sistema o una configuración errónea.

    La configuración errónea se puede producir cuando el servidor Web no está configurado para recibir en todas las combinaciones de puerto y dirección IP que se están analizando. El servidor Web debería dar servicio a todos los puertos de cada dirección IP especificada para el recurso.

    Las configuraciones erróneas se pueden producir también cuando las propiedades de recurso Network_resources_used y Port_list no se han configurado correctamente al crear el recurso.

    Si la respuesta a la consulta no se recibe en el límite de tiempo del recurso Probe_timeout, el análisis considera que es un fallo de Sun Cluster HA for Sun Java System Web Server. El fallo se registra en el historial de análisis.

    Un fallo de análisis puede ser parcial o total. Los siguientes fallos se consideran totales.

    • No ha sido posible conectarse al servidor, como indica el siguiente mensaje de error, donde %s es el nombre del sistema y %d el número del puerto.


      Failed to connect to %s port %d
    • El tiempo de espera se agota (se supera el tiempo de espera de la propiedad de recurso Probe_timeout), después de intentar conectarse al servidor.

    • No ha sido posible enviar la cadena del análisis al servidor, como indica el siguiente indicador, donde el primer %s representa el nombre del sistema y %d el número de puerto. El segundo %s da más detalles sobre el error.


      Failed to communicate with server %s port %d: %s

    El supervisor acumula dos fallos parciales como estos en el intervalo de la propiedad de recurso Retry_interval y los cuenta como uno solo.

    Los siguientes fallos se consideran parciales.

    • El tiempo de espera se agota (se excede el tiempo de espera de la propiedad de recurso Probe_timeout) al intentar leer la respuesta del servidor a la consulta del análisis.

    • No ha sido posible leer los datos del servidor por otros motivos, como indica el siguiente mensaje de error, donde %s indica el nombre del sistema y %d el número de puerto. El segundo %s da más detalles sobre el error.


      Failed to communicate with server %s port %d: %s
  3. El análisis se conecta con el servidor Sun Java System Web Server y efectúa una comprobación de HTTP 1.1 GET, enviando una solicitud de HTTP a cada uno de los URI de Monitor_Uri_List. Si el código de retorno del servidor es HTTP 500 (Internal Server Error) o si la conexión falla, el análisis entrará en acción.

    El resultado de las solicitudes de HTTP puede ser no satisfactorio o satisfactorio. Si todas las solicitudes reciben satisfactoriamente una respuesta del servidor Sun Java System Web Server, el análisis retorna y realiza el siguiente ciclo de análisis y reposo.

    Un tráfico pesado en la red, una carga elevada del sistema o una configuración errónea pueden hacer que el análisis HTTP GET falle. La configuración errónea de la propiedad Monitor_Uri_List puede provocar un fallo si un URI en Monitor_Uri_List incluye un puerto o nombre de sistema incorrecto. Por ejemplo, si la instancia de servidor Web está recibiendo en un sistema lógico schost-1 y se especificó el URI como http://schost-2/servlet/monitor, el análisis intentará ponerse en contacto con schost-2 para solicitar /servlet/monitor.

    Basado en el historial de fallos, un fallo puede provocar un reinicio local o una recuperación de fallos del servicio de datos. Esta acción se describe con más detalle en “Sun Cluster Data Service Fault Monitors” in Sun Cluster Data Services Planning and Administration Guide for Solaris OS.