Omitir Vínculos de navegación | |
Salir de la Vista de impresión | |
![]() |
Guía de servicio de datos de Oracle para Oracle Real Application Clusters Oracle Solaris Cluster 3.3 3/13 (Español) |
1. Instalación de Soporte para Oracle RAC
2. Configuración del almacenamiento para archivos de Oracle
3. Registro y configuración de los grupos de recursos
4. Activación de Oracle RAC para ejecutarse en un cluster
5. Administración de Soporte para Oracle RAC
6. Resolución de problemas de Soporte para Oracle RAC
Verificación del estado de Soporte para Oracle RAC
Cómo verificar el estado de Soporte para Oracle RAC
Ejemplos de estado de Soporte para Oracle RAC
Fuentes de información de diagnóstico
Problemas comunes y sus soluciones
Fallo de un grupo de recursos de estructura de Oracle RAC
Error grave del nodo al inicializar Soporte para Oracle RAC
Fallo del daemon ucmmd al iniciarse
Cómo recuperarse de un fallo del daemon ucmmd o de un componente relacionado
Fallo de un grupo de recursos de estructura de gestor de volúmenes de múltiples propietarios
Error grave de nodo al inicializar la estructura del gestor de volúmenes de múltiples propietarios
Fallo del daemon vucmmd al iniciarse
Cómo recuperarse de un fallo del daemon vucmmd o de un componente relacionado
El registro de SUNW.qfs falla porque el archivo de registro no se encuentra
Error grave de nodo debido a un tiempo de espera finalizado
Fallo de un recurso SUNW.rac_framework o SUNW.vucmm_framework al iniciar
Mensajes de estado de fallo al iniciar SUNW.rac_framework
Mensajes de estado de fallo al iniciar SUNW.vucmm_framework
Cómo recuperarse de la finalización del tiempo de espera del método START
7. Modificación de una configuración existente de Soporte para Oracle RAC
8. Actualización de Soporte para Oracle RAC
A. Ejemplos de configuraciones de este servicio de datos
B. Acciones preestablecidas para errores de DBMS y alertas registradas
C. Propiedades de extensión de Soporte para Oracle RAC
En las subsecciones siguientes, se describen problemas que pueden afectar a Soporte para Oracle RAC. Cada subsección brinda información relativa a la causa del problema, así como una solución.
Fallo de un grupo de recursos de estructura de gestor de volúmenes de múltiples propietarios
El registro de SUNW.qfs falla porque el archivo de registro no se encuentra
Fallo de un recurso SUNW.rac_framework o SUNW.vucmm_framework al iniciar
Cómo recuperarse de la finalización del tiempo de espera del método START
En esta sección, se describen problemas que pueden afectar el grupo de recursos de estructura de Oracle RAC.
Si ocurre un problema fatal al inicializar Soporte para Oracle RAC, el nodo genera un mensaje de aviso grave similar al siguiente mensaje de error:
panic[cpu0]/thread=40037e60: Failfast: Aborting because "ucmmd" died 30 seconds ago
Descripción: un componente controlado por el UCMM ha devuelto un error al UCMM durante una reconfiguración.
Causa: las causas más habituales de este problema son las siguientes:
SPARC: El paquete ORCLudlm que contiene UDLM no está instalado.
SPARC: La versión de UDLM no es compatible con la versión de Soporte para Oracle RAC.
SPARC: La cantidad de memoria compartida no es suficiente para activar UDLM para que se inicie.
Un nodo también puede generar un mensaje de aviso grave al inicializar Soporte para Oracle RAC porque se ha finalizado el tiempo de espera asignado al paso de reconfiguración. Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera finalizado.
Solución: Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un fallo del daemon ucmmd o de un componente relacionado.
Nota - Cuando el nodo es un nodo de votación de cluster global, el error grave del nodo interrumpe el equipo entero. Cuando el nodo es un nodo de cluster de zona, el error grave del nodo sólo interrumpe esa zona específica y las demás zonas no son afectadas.
El daemon de UCMM, ucmmd, se encarga de la reconfiguración de Soporte para Oracle RAC. Cuando un cluster se inicia o se reinicia, este daemon se inicia únicamente después de que se validan todos los componentes de Soporte para Oracle RAC. Si la validación de un componente en un nodo falla, el daemon ucmmd no se inicia en el nodo.
Las causas más habituales de este problema son las siguientes:
SPARC: El paquete ORCLudlm que contiene UDLM no está instalado.
Se ha producido un error durante la reconfiguración anterior de un componente de Soporte para Oracle RAC.
Un paso en una reconfiguración anterior de Soporte para Oracle RAC superó el tiempo de espera, lo que generó un error grave en el nodo donde terminó el tiempo de espera.
si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un fallo del daemon ucmmd o de un componente relacionado.
Realice esta tarea para corregir los problemas que se describen en las siguientes secciones:
Para la ubicación de los archivos de registro de las reconfiguraciones de UCMM, consulte Fuentes de información de diagnóstico.
Al examinar estos archivos, comience por el mensaje más reciente y vaya retrocediendo hasta identificar la causa del problema.
Para obtener más información sobre los mensajes de error que pudieran indicar la causa de errores de reconfiguración, consulte la Oracle Solaris Cluster Error Messages Guide.
Por ejemplo:
Nota - UDLM se requiere solamente cuando se utiliza.
Los procedimientos que debe completar se muestran en Tabla 1-1.
Para obtener más información, consulte SPARC: Instalación de UDLM.
Para obtener más información, consulte SPARC: Instalación de UDLM.
Para obtener más información, consulte Cómo configurar la memoria compartida para el software de Oracle RAC en el cluster global.
Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera finalizado.
Únicamente la solución a determinados problemas requiere un reinicio. Por ejemplo, el aumento de memoria compartida requiere un reinicio. Sin embargo, el aumento del valor del tiempo de espera de un paso no requiere un reinicio.
Para obtener más información sobre el reinicio de un nodo, consulte Cierre y arranque de un solo nodo de un clúster de Guía de administración del sistema de Oracle Solaris Cluster.
Este paso actualiza el grupo de recursos con los cambios en la configuración que ha efectuado.
# clresourcegroup offline -n node rac-fmwk-rg
Especifica el nombre o el identificador de nodo (ID) del nodo donde ocurrió el problema.
Especifica el nombre del grupo de recursos que se va a poner fuera de línea.
# clresourcegroup online -emM -n node rac-fmwk-rg
En esta sección, se describen problemas que pueden afectar el grupo de recursos de estructura de gestor de volúmenes de múltiples propietarios.
Error grave de nodo al inicializar la estructura del gestor de volúmenes de múltiples propietarios
Cómo recuperarse de un fallo del daemon vucmmd o de un componente relacionado
Si ocurre un problema fatal durante la inicialización de la estructura del gestor de volúmenes de múltiples propietarios, el nodo genera un mensaje de aviso grave similar al siguiente mensaje de error:
Nota - Cuando el nodo es un nodo de votación de cluster global, el error grave del nodo interrumpe el equipo entero.
panic[cpu0]/thread=40037e60: Failfast: Aborting because "vucmmd" died 30 seconds ago
Descripción: un componente que controla la estructura del administrador de volúmenes de múltiples propietarios ha devuelto un error a la estructura del administrador de volúmenes de múltiples propietarios durante una reconfiguración.
Causa: las causas más habituales de este problema es que falta o caducó la licencia de Veritas Volume Manager (VxVM).
También es posible que un nodo tenga una situación crítica al inicializar la estructura del administrador de volúmenes de múltiples propietarios porque un paso de reconfiguración ha sufrido un tiempo de espera. Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera finalizado.
Solución: si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un fallo del daemon vucmmd o de un componente relacionado.
El daemon de la estructura del gestor de volúmenes de múltiples propietarios, vucmmd, gestiona la reconfiguración de la estructura del gestor de volúmenes de múltiples propietarios. Al iniciar o reiniciar un cluster, este daemon se inicia únicamente después de que se validan todos los componentes de la estructura del gestor de volúmenes de múltiples propietarios. Si la validación de un componente en un nodo falla, el daemon vucmmd no se inicia en el nodo.
Las causas más habituales de este problema son las siguientes:
Se ha producido un error durante una reconfiguración anterior de un componente de la estructura del gestor de volúmenes de múltiples propietarios.
Un paso en una reconfiguración anterior de la estructura del gestor de volúmenes de múltiples propietarios superó el tiempo de espera, lo que generó un error grave en el nodo donde terminó el tiempo de espera.
Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un fallo del daemon vucmmd o de un componente relacionado.
Realice esta tarea para corregir los problemas que se describen en las siguientes secciones:
Para conocer la ubicación de los archivos de registro de las reconfiguraciones de la estructura del gestor de volúmenes de múltiples propietarios, consulte Fuentes de información de diagnóstico.
Al examinar estos archivos, comience por el mensaje más reciente y vaya retrocediendo hasta identificar la causa del problema.
Para obtener más información sobre los mensajes de error que pudieran indicar la causa de errores de reconfiguración, consulte la Oracle Solaris Cluster Error Messages Guide.
Por ejemplo:
Nota - Un cluster de zona no admite VxVM.
Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera finalizado.
Únicamente la solución a determinados problemas requiere un reinicio. Por ejemplo, el aumento de memoria compartida requiere un reinicio. Sin embargo, el aumento del valor del tiempo de espera de un paso no requiere un reinicio.
Para obtener más información sobre el reinicio de un nodo, consulte Cierre y arranque de un solo nodo de un clúster de Guía de administración del sistema de Oracle Solaris Cluster.
Este paso actualiza el grupo de recursos con los cambios en la configuración que ha efectuado.
# clresourcegroup offline -n node vucmm-fmwk-rg
Especifica el nombre o el identificador de nodo (ID) del nodo donde ocurrió el problema.
Especifica el nombre del grupo de recursos que se va a poner fuera de línea.
# clresourcegroup online -emM -n node vucmm-fmwk-rg
Los archivos de registro del tipo de recurso de Oracle Solaris Cluster están en el directorio /opt/cluster/lib/rgm/rtreg/ o /usr/cluster/lib/rgm/rtreg/. El archivo de registro del tipo de recurso SUNW.qfs se encuentra en el directorio /opt/SUNWsamfs/sc/etc/.
Si el software Oracle Solaris Cluster ya está instalado al instalar el software de software Sun QFS, la asignación necesaria para el archivo de registro SUNW.qfs se crea automáticamente. Pero si el software Oracle Solaris Cluster no está instalado al instalar el software Sun QFS, la asignación necesaria para el archivo de registro SUNW.qfs se realiza, incluso cuando el software Sun Cluster se instale más tarde. Intenta registrar el tipo de recurso SUNW.qfs, por lo tanto, falla por que el software Oracle Solaris Cluster no conoce la ubicación de su archivo de registro.
Para permitir que el software Oracle Solaris Cluster ubique el tipo de recurso SUNW.qfs, cree un enlace al directorio:
# cd /usr/cluster/lib/rgm/rtreg # ln -s /opt/SUNWsamfs/sc/etc/SUNW.qfs SUNW.qfs
La finalización del tiempo de espera de cualquier paso en la reconfiguración de Soporte para Oracle RAC hace que se genere un error grave en el nodo donde terminó el tiempo de espera.
Para evitar que se termine el tiempo de espera de los pasos de reconfiguración, ajuste los tiempos de espera que dependen de la configuración del cluster. Para obtener más información, consulte Directrices para configurar tiempos de espera.
Si finaliza el tiempo de espera de un paso de reconfiguración, utilice los comandos de mantenimiento de Oracle Solaris Cluster para aumentar el valor de la propiedad de extensión que especifica el tiempo de espera para el paso. Para obtener más información, consulte el Apéndice CPropiedades de extensión de Soporte para Oracle RAC.
Después de haber aumentado el valor de la propiedad de extensión, ponga en línea el grupo de recursos de estructura de Oracle RAC en el nodo donde se generó el error grave.
Si el recurso SUNW.rac_framework o SUNW.vucmm_framework no se inicia, compruebe el estado del recurso para determinar la causa del fallo. Para obtener más información, consulte Cómo verificar el estado de Soporte para Oracle RAC.
El estado de un recurso que no se pudo iniciar se muestra como Start failed. El mensaje de estado asociado indica la causa del fallo al iniciar.
Esta sección contiene la siguiente información:
Los siguientes mensajes de estado están asociados con el fallo de un recurso SUNW.rac_framework al iniciar:
Faulted - ucmmd is not running
Descripción: el daemon ucmmd no se está ejecutando en el nodo donde reside el recurso.
Solución: para obtener información sobre la corrección de este problema, consulte Fallo del daemon ucmmd al iniciarse.
Degraded - reconfiguration in progress
Descripción: El UCMM se está reconfigurando. Este mensaje indica un problema sólo si la reconfiguración del UCMM no se completa y el estado de este recurso sigue siendo degradado.
Causa: si este mensaje indica un problema, la causa del fallo es un error de configuración en uno o más componentes de Soporte para Oracle RAC.
Solución: la solución de este problema depende de si el mensaje indica un problema:
Si el mensaje indica un problema, corríjalo del modo que se explica en Cómo recuperarse de un fallo del daemon ucmmd o de un componente relacionado.
Si el mensaje no indica ningún problema, no se requiere ninguna acción.
Descripción: la reconfiguración de Oracle RAC no se completó hasta que finalizó el tiempo de espera del método START del recurso SUNW.rac_framework.
Solución: si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de la finalización del tiempo de espera del método START.
Los siguientes mensajes de estado están asociados con el fallo de un recurso SUNW.vucmm_framework al iniciar:
Faulted - vucmmd is not running
Descripción: el daemon vucmmd no se está ejecutando en el nodo donde reside el recurso.
Solución: para obtener información sobre cómo corregir este problema, consulte Fallo del daemon vucmmd al iniciarse.
Degraded - reconfiguration in progress
Descripción: la estructura del gestor de volúmenes de múltiples propietarios se está reconfigurando. Este mensaje indica un problema sólo si la reconfiguración de la estructura del gestor de volúmenes de múltiples propietarios no se completa y el estado de este recurso sigue siendo degradado.
Causa: si este mensaje indica un problema, la causa del fallo es un error de configuración en uno o más componentes de la estructura de reconfiguración del gestor de volúmenes.
Solución: la solución de este problema depende de si el mensaje indica un problema:
Si el mensaje indica un problema, corríjalo del modo que se explica en Cómo recuperarse de un fallo del daemon vucmmd o de un componente relacionado.
Si el mensaje no indica ningún problema, no se requiere ninguna acción.
Descripción: la reconfiguración de Oracle RAC no se completó hasta que finalizó el tiempo de espera del método START del recurso SUNW.vucmm_framework.
Solución: si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de la finalización del tiempo de espera del método START.
Para llevar a cabo esta operación, cambie los nodos principales del grupo de recursos por los otros nodos en que el grupo está en línea.
# clresourcegroup offline -n nodelist resource-group
Especifica una lista separada por comas de otros nodos del cluster en que resource-group está en línea. Omita de esta lista el nodo en que finalizó el tiempo de espera del método START.
Especifica el nombre del grupo de recursos de estructura.
Si la configuración utiliza un grupo de recursos de la estructura del gestor de volúmenes de múltiples propietarios y un grupo de recursos de la estructura de Oracle RAC, ponga fuera de línea el grupo de recursos de la estructura del gestor de volúmenes de múltiples propietarios. Cuando el grupo de recursos de la estructura del gestor de volúmenes de múltiples propietarios está fuera de línea, ponga fuera de línea el grupo de recursos de la estructura de Oracle RAC.
Si el grupo de recursos Oracle RAC se creó con la utilidad clsetup, el nombre del grupo de recursos es rac-framework-rg.
# clresourcegroup online resource-group
Especifica que el grupo de recursos que se puso fuera de línea en el Paso 2 se va a mover al estado MANAGED y se va a poner en línea.
Si un recurso no se puede detener, corrija el problema como se explica en Clearing the STOP_FAILED Error Flag on Resources de Oracle Solaris Cluster Data Services Planning and Administration Guide.