Omitir V�nculos de navegaci�n | |
Salir de la Vista de impresi�n | |
Servicio de datos de Oracle para la Guía de clústeres de aplicación real de Oracle Oracle Solaris Cluster 4.0 (Español) |
1. Instalación de Soporte para Oracle RAC
2. Configuración del almacenamiento para archivos de Oracle
3. Registro y configuración de los grupos de recursos
4. Activación de Oracle RAC para ejecutarse en un clúster
5. Administración de Soporte para Oracle RAC
6. Resolución de problemas de Soporte para Oracle RAC
Verificación del estado de Soporte para Oracle RAC
Cómo verificar el estado de Soporte para Oracle RAC
Fuentes de información de diagnóstico
Problemas comunes y sus soluciones
Fallo de un grupo de recursos de estructura de Oracle RAC
Error grave del nodo al inicializar Soporte para Oracle RAC
Fallo del daemon ucmmd al iniciarse
Cómo recuperarse de un fallo del daemon ucmmd o de un componente relacionado
Fallo de un grupo de recursos de estructura de gestor de volúmenes de múltiples propietarios
Error grave de nodo al inicializar la estructura del gestor de volúmenes de múltiples propietarios
Fallo del daemon vucmmd al iniciarse
Cómo recuperarse de un fallo del daemon vucmmd o de un componente relacionado
Error grave de nodo debido a un tiempo de espera finalizado
Fallo de un recurso SUNW.rac_framework o SUNW.vucmm_framework al iniciar
Mensajes de estado de fallo al iniciar SUNW.rac_framework
Mensajes de estado de fallo al iniciar SUNW.vucmm_framework
Cómo recuperarse de la finalización del tiempo de espera del método START
7. Modificación de una configuración existente de Soporte para Oracle RAC
A. Ejemplos de configuraciones de este servicio de datos
B. Acciones preestablecidas para errores de DBMS y alertas registradas
C. Propiedades de extensión de Soporte para Oracle RAC
En las subsecciones siguientes, se describen problemas que pueden afectar a Soporte para Oracle RAC. Cada subsección brinda información relativa a la causa del problema, así como una solución.
Fallo de un grupo de recursos de estructura de gestor de volúmenes de múltiples propietarios
Fallo de un recurso SUNW.rac_framework o SUNW.vucmm_framework al iniciar
Cómo recuperarse de la finalización del tiempo de espera del método START
En esta sección, se describen problemas que pueden afectar el grupo de recursos de estructura de Oracle RAC.
Si ocurre un problema fatal al inicializar Soporte para Oracle RAC, el nodo genera un mensaje de aviso grave similar al siguiente mensaje de error:
panic[cpu0]/thread=40037e60: Failfast: Aborting because "ucmmd" died 30 seconds ago
Descripción: Un componente controlado por el UCMM ha devuelto un error al UCMM durante una reconfiguración.
Causa: Las causas más habituales de este problema son las siguientes:
Un nodo también puede generar un mensaje de aviso grave al inicializar Soporte para Oracle RAC porque se ha finalizado el tiempo de espera asignado al paso de reconfiguración. Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera finalizado.
Solución: Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un fallo del daemon ucmmd o de un componente relacionado.
Nota - Cuando el nodo es un nodo de votación de clúster global, el error grave del nodo interrumpe el equipo entero. Cuando el nodo es un nodo de clúster de zona, el error grave del nodo sólo interrumpe esa zona específica y las demás zonas no son afectadas.
El daemon de UCMM, ucmmd, se encarga de la reconfiguración de Soporte para Oracle RAC. Cuando un clúster se inicia o se reinicia, este daemon se inicia únicamente después de que se validan todos los componentes de Soporte para Oracle RAC. Si la validación de un componente en un nodo falla, el daemon ucmmd no se inicia en el nodo.
Las causas más habituales de este problema son las siguientes:
Se ha producido un error durante la reconfiguración anterior de un componente de Soporte para Oracle RAC.
Un paso en una reconfiguración anterior de Soporte para Oracle RAC superó el tiempo de espera, lo que generó un error grave en el nodo donde terminó el tiempo de espera.
Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un fallo del daemon ucmmd o de un componente relacionado.
Realice esta tarea para corregir los problemas que se describen en las siguientes secciones:
Para la ubicación de los archivos de registro de las reconfiguraciones de UCMM, consulte Fuentes de información de diagnóstico.
Al examinar estos archivos, comience por el mensaje más reciente y vaya retrocediendo hasta identificar la causa del problema.
Para obtener más información sobre los mensajes de error que pudieran indicar la causa de errores de reconfiguración, consulte la Oracle Solaris Cluster Error Messages Guide.
Por ejemplo:
Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera finalizado.
Únicamente la solución a determinados problemas requiere un reinicio. Por ejemplo, el aumento de memoria compartida requiere un reinicio. Sin embargo, el aumento del valor del tiempo de espera de un paso no requiere un reinicio.
Para obtener más información sobre el reinicio de un nodo, consulte Cierre y arranque de un solo nodo de un clúster de Guía de administración del sistema de Oracle Solaris Cluster.
Este paso actualiza el grupo de recursos con los cambios en la configuración que ha efectuado.
# clresourcegroup offline -n node rac-fmwk-rg
Especifica el nombre o el identificador de nodo (ID) del nodo donde ocurrió el problema.
Especifica el nombre del grupo de recursos que se va a poner fuera de línea.
# clresourcegroup online -emM -n node rac-fmwk-rg
En esta sección, se describen problemas que pueden afectar el grupo de recursos de estructura de gestor de volúmenes de múltiples propietarios.
Error grave de nodo al inicializar la estructura del gestor de volúmenes de múltiples propietarios
Cómo recuperarse de un fallo del daemon vucmmd o de un componente relacionado
Si ocurre un problema fatal durante la inicialización de la estructura del gestor de volúmenes de múltiples propietarios, el nodo genera un mensaje de aviso grave similar al siguiente mensaje de error:
Nota - Cuando el nodo es un nodo de votación de clúster global, el error grave del nodo interrumpe el equipo entero.
El daemon de la estructura del gestor de volúmenes de múltiples propietarios, vucmmd, gestiona la reconfiguración de la estructura del gestor de volúmenes de múltiples propietarios. Al iniciar o reiniciar un clúster, este daemon se inicia únicamente después de que se validan todos los componentes de la estructura del gestor de volúmenes de múltiples propietarios. Si la validación de un componente en un nodo falla, el daemon vucmmd no se inicia en el nodo.
Las causas más habituales de este problema son las siguientes:
Se ha producido un error durante una reconfiguración anterior de un componente de la estructura del gestor de volúmenes de múltiples propietarios.
Un paso en una reconfiguración anterior de la estructura del gestor de volúmenes de múltiples propietarios superó el tiempo de espera, lo que generó un error grave en el nodo donde terminó el tiempo de espera.
Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un fallo del daemon vucmmd o de un componente relacionado.
Realice esta tarea para corregir los problemas que se describen en las siguientes secciones:
Para conocer la ubicación de los archivos de registro de las reconfiguraciones de la estructura del gestor de volúmenes de múltiples propietarios, consulte Fuentes de información de diagnóstico.
Al examinar estos archivos, comience por el mensaje más reciente y vaya retrocediendo hasta identificar la causa del problema.
Para obtener más información sobre los mensajes de error que pudieran indicar la causa de errores de reconfiguración, consulte la Oracle Solaris Cluster Error Messages Guide.
Únicamente la solución a determinados problemas requiere un reinicio. Por ejemplo, el aumento de memoria compartida requiere un reinicio. Sin embargo, el aumento del valor del tiempo de espera de un paso no requiere un reinicio.
Para obtener más información sobre el reinicio de un nodo, consulte Cierre y arranque de un solo nodo de un clúster de Guía de administración del sistema de Oracle Solaris Cluster.
Este paso actualiza el grupo de recursos con los cambios en la configuración que ha efectuado.
# clresourcegroup offline -n node vucmm-fmwk-rg
Especifica el nombre o el identificador de nodo (ID) del nodo donde ocurrió el problema.
Especifica el nombre del grupo de recursos que se va a poner fuera de línea.
# clresourcegroup online -emM -n node vucmm-fmwk-rg
La finalización del tiempo de espera de cualquier paso en la reconfiguración de Soporte para Oracle RAC hace que se genere un error grave en el nodo donde terminó el tiempo de espera.
Para evitar que se termine el tiempo de espera de los pasos de reconfiguración, ajuste los tiempos de espera que dependen de la configuración del clúster. Para obtener más información, consulte Directrices para configurar tiempos de espera.
Si finaliza el tiempo de espera de un paso de reconfiguración, utilice los comandos de mantenimiento de Oracle Solaris Cluster para aumentar el valor de la propiedad de extensión que especifica el tiempo de espera para el paso. Para obtener más información, consulte el Apéndice CPropiedades de extensión de Soporte para Oracle RAC.
Después de haber aumentado el valor de la propiedad de extensión, ponga en línea el grupo de recursos de estructura de Oracle RAC en el nodo donde se generó el error grave.
Si el recurso SUNW.rac_framework o SUNW.vucmm_framework no se inicia, compruebe el estado del recurso para determinar la causa del fallo. Para obtener más información, consulte Cómo verificar el estado de Soporte para Oracle RAC.
El estado de un recurso que no se pudo iniciar se muestra como Start failed. El mensaje de estado asociado indica la causa del fallo al iniciar.
Esta sección contiene la siguiente información:
Los siguientes mensajes de estado están asociados con el fallo de un recurso SUNW.rac_framework al iniciar:
Faulted - ucmmd is not running
Descripción: El daemon ucmmd no se está ejecutando en el nodo donde reside el recurso.
Solución: Para obtener información sobre la corrección de este problema, consulte Fallo del daemon ucmmd al iniciarse.
Degraded - reconfiguration in progress
Descripción: El UCMM se está reconfigurando. Este mensaje indica un problema sólo si la reconfiguración del UCMM no se completa y el estado de este recurso sigue siendo degradado.
Causa: Si este mensaje indica un problema, la causa del fallo es un error de configuración en uno o más componentes de Soporte para Oracle RAC.
Solución: La solución de este problema depende de si el mensaje indica un problema:
Si el mensaje indica un problema, corríjalo del modo que se explica en Cómo recuperarse de un fallo del daemon ucmmd o de un componente relacionado.
Si el mensaje no indica ningún problema, no se requiere ninguna acción.
Descripción: La reconfiguración de Oracle RAC no se completó hasta que finalizó el tiempo de espera del método START del recurso SUNW.rac_framework.
Solución: Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de la finalización del tiempo de espera del método START.
Los siguientes mensajes de estado están asociados con el fallo de un recurso SUNW.vucmm_framework al iniciar:
Faulted - vucmmd is not running
Descripción: El daemon vucmmd no se está ejecutando en el nodo donde reside el recurso.
Solución: Para obtener información sobre cómo corregir este problema, consulte Fallo del daemon vucmmd al iniciarse.
Degraded - reconfiguration in progress
Descripción: La estructura del gestor de volúmenes de múltiples propietarios se está reconfigurando. Este mensaje indica un problema sólo si la reconfiguración de la estructura del gestor de volúmenes de múltiples propietarios no se completa y el estado de este recurso sigue siendo degradado.
Causa: Si este mensaje indica un problema, la causa del fallo es un error de configuración en uno o más componentes de la estructura de reconfiguración del gestor de volúmenes.
Solución: La solución de este problema depende de si el mensaje indica un problema:
Si el mensaje indica un problema, corríjalo del modo que se explica en Cómo recuperarse de un fallo del daemon vucmmd o de un componente relacionado.
Si el mensaje no indica ningún problema, no se requiere ninguna acción.
Descripción: La reconfiguración de Oracle RAC no se completó hasta que finalizó el tiempo de espera del método START del recurso SUNW.vucmm_framework.
Solución: Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de la finalización del tiempo de espera del método START.
Para llevar a cabo esta operación, cambie los nodos principales del grupo de recursos por los otros nodos en que el grupo está en línea.
# clresourcegroup offline -n nodelist resource-group
Especifica una lista separada por comas de otros nodos del clúster en que resource-group está en línea. Omita de esta lista el nodo en que finalizó el tiempo de espera del método START.
Especifica el nombre del grupo de recursos de estructura.
Si la configuración utiliza un grupo de recursos de la estructura del gestor de volúmenes de múltiples propietarios y un grupo de recursos de la estructura de Oracle RAC, ponga fuera de línea el grupo de recursos de la estructura del gestor de volúmenes de múltiples propietarios. Cuando el grupo de recursos de la estructura del gestor de volúmenes de múltiples propietarios está fuera de línea, ponga fuera de línea el grupo de recursos de la estructura de Oracle RAC.
Si el grupo de recursos de la estructura de Oracle RAC se creó con la utilidad clsetup, el nombre del grupo de recursos es rac-framework-rg.
# clresourcegroup online resource-group
Especifica que el grupo de recursos que se puso fuera de línea en el Paso 2 se va a mover al estado MANAGED y se va a poner en línea.
Si un recurso no se puede detener, corrija el problema como se explica en Clearing the STOP_FAILED Error Flag on Resources de Oracle Solaris Cluster Data Services Planning and Administration Guide.