Guía de Sun Cluster Data Service para Sun Java System Application Server EE (HADB) para el sistema operativo Solaris

Ajuste del supervisor de fallos de Sun Cluster HA para Sun Java System Application Server EE (HADB)

El supervisor de fallos de Sun Cluster HA para Sun Java System Application Server EE (HADB) se incluye en el recurso que representa a Sun Java System Application Server EE (HADB). Puede crear este recurso al registrar y configurar Sun Cluster HA para Sun Java System Application Server EE (HADB). Para obtener más información, consulte Registro y configuración de Sun Cluster HA para Sun Java System Application Server EE (HADB).

Las propiedades del sistema y las de extensión de este recurso controlan el comportamiento del supervisor de fallos. Los valores predeterminados de estas propiedades determinan el comportamiento predefinido del supervisor de fallos. Este comportamiento predefinido debe adaptarse a la mayoría de las instalaciones de Sun Cluster. Por lo tanto, sólo debe ajustar el supervisor de fallos si necesita modificar este comportamiento predefinido.

Para obtener más información, consulte las siguientes secciones.

Operaciones realizadas por el supervisor de fallos durante el análisis

El método de inicio del recurso HADB arranca los nodos HADB configurados para que se ejecuten en el nodo local de Sun Cluster si no están en ejecución. Este método intenta iniciar a continuación la base de datos HADB. Si se produce un fallo, la base de datos se inicia más adelante durante el análisis.

El análisis del supervisor de fallos comprueba el estado de la base de datos HADB y sus nodos. El análisis reinicia los nodos de HADB que presentaban fallos. También inicia la base de datos HADB si el recurso HADB no está listo para iniciar la base de datos durante el método de arranque. Para cada iteración de este proceso, el análisis lleva a cabo estos pasos:

  1. El análisis recupera el estado actual de la base de datos HADB y los nodos mediante la ejecución de los comandos hadbm status y hadbm status --nodes.

  2. Si la base de datos no se ejecuta, el análisis comprueba que exista el archivo stopstate de HADB correspondiente a esa base de datos en el nodo local de Sun Cluster. El comando hadbm start hace referencia al archivo stopstate para la asignación de roles de los nodos al iniciar la base de datos.

  3. Si el archivo stopstate existe, el recurso de HADB lo examina para determinar si se puede iniciar la base de datos.

    • En caso afirmativo, el análisis inicia la base de datos y establece el estado del recurso como Online.

    • En caso negativo, el análisis establece el estado del recurso como Online Degraded.

  4. Si la base de datos se está ejecutando, el análisis inicia los nodos de HADB que están configurados para ejecutarse en el nodo local de Sun Cluster.

  5. Si la base de datos y los nodos locales de HADB se están ejecutando, el análisis establece el estado del recurso como Online si anteriormente era Online Degraded.

  6. Si, en todos los nodos de Sun Cluster del grupo de recursos de HADB, se ejecuta el recurso HADB con el estado Online Degraded durante más de Stop_timeout segundos, el recurso HADB estima que la base de datos no puede iniciarse. Para obtener una descripción de la propiedad Stop_timeout, consulte la propiedad de recurso method_timeout en el Apéndice A, Standard Properties de Sun Cluster Data Services Planning and Administration Guide for Solaris OS.

  7. Si la propiedad de extensión Auto_recovery se establece en TRUE, el recurso HADB intenta recuperar la base de datos.

  8. Para intentar recuperar la base de datos el análisis efectúa este proceso:

    • Ejecuta el comando hadbm clear --fast en uno de los nodos de Sun Cluster de la lista de nodos del grupo de recursos. que borra el contenido de la base de datos, la reinicializa y la vuelve a arrancar.

    • Si el comando hadbm clear tiene éxito, se emite el comando especificado en Auto_recovery_command en el mismo nodo de Sun Cluster en el que se ha emitido el comando hadbm clear. Este comando, normalmente, debe ser una secuencia que contenga el comando asadmin create-session-store, pero también puede llevar a cabo otras acciones, Por ejemplo, también puede enviar un mensaje de correo electrónico al administrador de Application Server.

    • Si ambos pasos se realizan con éxito, el análisis establece el estado del recurso como Online.