Omitir Vínculos de navegación | |
Salir de la Vista de impresión | |
![]() |
Guía del servicio de datos de Oracle Solaris Cluster para Oracle Real Application Clusters (RAC) |
1. Instalación de Admisión de Oracle RAC
2. Configuración del almacenamiento para archivos Oracle
3. Registro y configuración de grupos de recursos
4. Habilitación de Oracle RAC para ejecutarse en un clúster
5. Administración de Admisión de Oracle RAC
6. Solución de problemas de Admisión de Oracle RAC
Verificación del estado de Admisión de Oracle RAC
Cómo verificar el estado de Admisión de Oracle RAC
Ejemplos del estado de Admisión de Oracle RAC
Fuentes de información de diagnóstico
Problemas habituales y soluciones
Error de un grupo de recursos de estructura de RAC
Error grave de nodo al inicializar Admisión de Oracle RAC
Error del daemon ucmmd al iniciarse
Cómo recuperarse de un error del daemon ucmmd o de un componente relacionado
Error de un grupo de recursos de estructura de administrador de volúmenes de múltiples propietarios
Error del daemon vucmmd al iniciarse
Cómo recuperarse de un error del daemon vucmmd o de un componente relacionado
Error al registrar SUNW.qfs porque no se puede encontrar el archivo de registro
Error grave de nodo debido a un tiempo de espera
Error de un recurso SUNW.rac_framework o SUNW.vucmm_framework al iniciarse
Mensajes de estado de error al iniciarse de SUNW.rac_framework
Mensajes de estado de error al iniciarse de SUNW.vucmm_framework
Cómo recuperarse de la finalización de tiempo de espera del método START
7. Modificación de una configuración de Admisión de Oracle RAC
8. Actualización de Admisión de Oracle RAC
A. Ejemplos de configuraciones para este servicio de datos
B. Acciones preestablecidas para errores de DBMS y alertas registradas
C. Propiedades de extensión de Admisión de Oracle RAC
En las subsecciones siguientes se describen problemas que pueden afectar a Admisión de Oracle RAC. Cada subsección brinda información relativa a la causa del problema, así como una solución.
Error de un grupo de recursos de estructura de administrador de volúmenes de múltiples propietarios
Error al registrar SUNW.qfs porque no se puede encontrar el archivo de registro
Error de un recurso SUNW.rac_framework o SUNW.vucmm_framework al iniciarse
Mensajes de estado de error al iniciarse de SUNW.rac_framework
Mensajes de estado de error al iniciarse de SUNW.vucmm_framework
Cómo recuperarse de la finalización de tiempo de espera del método START
En esta sección, se describen problemas que pueden afectar al grupo de recursos de estructuras de RAC.
Si se da un problema fatal al inicializar Admisión de Oracle RAC, el nodo genera una situación de error grave con mensajes de error similares al siguiente:
panic[cpu0]/thread=40037e60: Failfast: Aborting because "ucmmd" died 30 seconds ago
Descripción: Un componente controlado por el UCMM ha devuelto un error al UCMM durante una reconfiguración.
Causa: Las causas más habituales de este problema son las siguientes:
SPARC: El paquete ORCLudlm que contiene el Oracle UDLM no está instalado.
SPARC: La versión de Oracle UDLM y la de Admisión de Oracle RAC son incompatibles.
SPARC: Oracle UDLM no se puede iniciar con la cantidad de memoria compartida disponible.
Un nodo también puede entrar en una situación de error grave al inicializar Admisión de Oracle RAC si finaliza el tiempo de espera asignado al paso de reconfiguración. Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera.
Solución: Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un error del daemon ucmmd o de un componente relacionado.
Nota - En el caso de un nodo de votación de clúster global de clúster global, el error grave del nodo repercute negativamente en toda la máquina. En el caso de un nodo de clúster de zona, el error grave del nodo afecta negativamente sólo a esa zona.
El daemon de UCMM, ucmmd, se encarga de la reconfiguración de Admisión de Oracle RAC. Al arrancar o rearrancar un clúster, este daemon se inicia únicamente después de haberse validado todos los componentes de Admisión de Oracle RAC. Si falla la validación de un componente, el daemon ucmmd no se llega a iniciar en el nodo.
Las causas más habituales de este problema son las siguientes:
SPARC: El paquete ORCLudlm que contiene el Oracle UDLM no está instalado.
Hubo un error durante la reconfiguración anterior de un componente de Admisión de Oracle RAC.
Finalizó el tiempo de espera de un paso en una reconfiguración anterior de Admisión de Oracle RAC, lo que hizo que el nodo donde terminó el tiempo de espera pasara a una situación de error grave.
Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un error del daemon ucmmd o de un componente relacionado.
Efectúe esta tarea para corregir los problemas que se describen en las secciones siguientes:
Si necesita saber las ubicaciones de los archivos de registro de las reconfiguraciones de UCMM, consulte Fuentes de información de diagnóstico.
Al examinar estos archivos, comience por el mensaje más reciente y vaya retrocediendo hasta identificar la causa del problema.
Para obtener más información sobre mensajes de error que pudieran indicar la causa de errores de reconfiguración, consulte Oracle Solaris Cluster Error Messages Guide.
Por ejemplo:
Nota - Oracle UDLM se necesita sólo cuando se utiliza.
Los procedimientos que se deben completar figuran en la Tabla 1-1.
Para obtener más información, consulte SPARC: Instalación de Oracle UDLM.
Para obtener más información, consulte SPARC: Instalación de Oracle UDLM.
Para obtener más información, consulte Cómo configurar la memoria compartida para Oracle RAC en el clúster global.
Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera.
Rearrancar es la solución únicamente de determinados problemas. Por ejemplo, el aumento de memoria compartida precisa rearrancar. Sin embargo, incrementar el tiempo de espera de un paso no requiere rearrancar.
Para obtener más información sobre cómo rearrancar un nodo, consulte Cierre y arranque de un solo nodo de un clúster de Guía de administración del sistema de Oracle Solaris Cluster.
Este paso actualiza el grupo de recursos con los cambios en la configuración que ha efectuado.
# clresourcegroup offline -n node rac-fmwk-rg
Especifica el nombre o el identificador de nodo (ID) del nodo donde se dio el problema.
Especifica el nombre del grupo de recursos que se va a poner fuera de línea.
# clresourcegroup online -emM -n node rac-fmwk-rg
En esta sección, se describen problemas que pueden afectar al grupo de recursos de estructura de administrador de volúmenes de múltiples propietarios.
Si se da un problema fatal al inicializar la estructura de administrador de volúmenes de múltiples propietarios, el nodo genera una situación de error grave con mensajes de error similares al siguiente:
Nota - En el caso de un nodo de votación de clúster global del clúster global, el error grave del nodo repercute negativamente en toda la máquina.
panic[cpu0]/thread=40037e60: Failfast: Aborting because "vucmmd" died 30 seconds ago
Descripción: Un componente controlado por la estructura de administrador de volúmenes de múltiples propietarios ha devuelto un mensaje de error a dicha estructura durante una reconfiguración.
Causa: Las causas más habituales de este problema son que Veritas Volume Manager (VxVM) carece de licencia o que la licencia está caducada.
Un nodo también puede entrar en una situación de error grave al inicializar la estructura de administrador de volúmenes de múltiples propietarios al finalizar el tiempo de espera asignado al paso de reconfiguración. Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera.
Solución: Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un error del daemon vucmmd o de un componente relacionado.
El daemon vucmmd de la estructura de administrador de volúmenes de múltiples propietarios se encarga de reconfigurar dicha estructura. Al arrancar o rearrancar un clúster, este daemon se inicia únicamente después de haberse validado todos los componentes de la estructura de administrador de volúmenes de múltiples propietarios. Si falla la validación de un componente en un nodo, el daemon vucmmd no se llega a iniciar en el nodo.
Las causas más habituales de este problema son las siguientes:
Hubo un error durante la reconfiguración anterior de un componente de la estructura de administrador de volúmenes de múltiples propietarios.
Finalizó el tiempo de espera de un paso en una reconfiguración anterior de la estructura de administrador de volúmenes de múltiples propietarios, cosa que hizo que el nodo donde terminó el tiempo de espera pasara a una situación de error grave.
Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un error del daemon vucmmd o de un componente relacionado.
Efectúe esta tarea para corregir los problemas que se describen en las secciones siguientes:
Si necesita saber las ubicaciones de los archivos de registro de las reconfiguraciones de la estructura de administrador de volúmenes de múltiples propietarios, consulte Fuentes de información de diagnóstico.
Al examinar estos archivos, comience por el mensaje más reciente y vaya retrocediendo hasta identificar la causa del problema.
Para obtener más información sobre mensajes de error que pudieran indicar la causa de errores de reconfiguración, consulte Oracle Solaris Cluster Error Messages Guide.
Por ejemplo:
Nota - Un clúster de zona no admite VxVM.
Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera.
Rearrancar es la solución únicamente de determinados problemas. Por ejemplo, el aumento de memoria compartida precisa rearrancar. Sin embargo, incrementar el tiempo de espera de un paso no requiere rearrancar.
Para obtener más información sobre cómo rearrancar un nodo, consulte Cierre y arranque de un solo nodo de un clúster de Guía de administración del sistema de Oracle Solaris Cluster.
Este paso actualiza el grupo de recursos con los cambios en la configuración que ha efectuado.
# clresourcegroup offline -n node vucmm-fmwk-rg
Especifica el nombre o el identificador de nodo (ID) del nodo donde se dio el problema.
Especifica el nombre del grupo de recursos que se va a poner fuera de línea.
# clresourcegroup online -emM -n node vucmm-fmwk-rg
Los archivos de registro de tipo de recurso de Oracle Solaris Cluster se ubican en el directorio /opt/cluster/lib/rgm/rtreg/ or /usr/cluster/lib/rgm/rtreg/. El archivo de registro de tipo de recurso de SUNW.qfs se ubica en el directorio /opt/SUNWsamfs/sc/etc/.
Si Oracle Solaris Cluster ya está instalado al instalar Sun QFS, de manera automática se crea la correspondiente asignación al archivo de registro SUNW.qfs. Sin embargo, si Oracle Solaris Cluster no está instalado todavía al instalar Sun QFS, no se efectúa la pertinente asignación al archivo de registro SUNW.qfs, ni siquiera si posteriormente se instala Sun Cluster. Por lo tanto, los intentos de registrar el tipo de recurso SUNW.qfs fallan debido a que Oracle Solaris Cluster desconoce la ubicación de su archivo de registro.
Para que Oracle Solaris Cluster pueda encontrar el tipo de recurso SUNW.qfs, cree un vínculo simbólico con el directorio:
# cd /usr/cluster/lib/rgm/rtreg # ln -s /opt/SUNWsamfs/sc/etc/SUNW.qfs SUNW.qfs
La finalización del tiempo de espera de cualquier paso en la reconfiguración de Admisión de Oracle RAC hace que el nodo donde se ha dado la finalización del tiempo de espera pase a un estado de error grave.
Para prevenir la finalización del tiempo de espera en los pasos de reconfiguración, ajuste los tiempos de espera que dependan de la configuración de clústers. Para obtener más información, consulte Directrices para configurar tiempos de espera.
Si finaliza el tiempo de espera de un paso de reconfiguración, utilice los comandos de mantenimiento de Oracle Solaris Cluster para incrementar el valor de la propiedad de extensión que especifica el tiempo de espera relativo al paso. Para obtener más información, consulte el Apéndice CPropiedades de extensión de Admisión de Oracle RAC.
Después de haber incrementado el valor de la propiedad de extensión, coloque en línea el grupo de recursos de estructura de RAC en el nodo que estaba en situación de error grave.
Si no se inicia un recurso SUNW.rac_framework o SUNW.vucmm_framework, compruebe el estado del recurso para determinar la causa del error. Para obtener más información, consulte Cómo verificar el estado de Admisión de Oracle RAC.
El estado de un recurso que no logra iniciarse se muestra como Start failed. El mensaje de estado asociado indica la causa del error al iniciarse.
Esta sección contiene la información siguiente:
Los mensajes de estado siguientes se asocian con el error de un recurso SUNW.rac_framework al iniciarse:
Faulted - ucmmd is not running
Descripción: El daemon ucmmd no se ejecuta en el nodo en que reside el recurso.
Solución: Para obtener información sobre cómo corregir este problema, consulte Error del daemon ucmmd al iniciarse.
Degraded - reconfiguration in progress
Descripción: El UCMM se está reconfigurando. Este mensaje denota un problema sólo si no se ha completado la reconfiguración del UCMM y si este recurso mantiene permanentemente el estado de degradado.
Causa: Si este mensaje denota un problema, la causa es un error de configuración en uno o más componentes de Admisión de Oracle RAC.
Solución: La solución de este problema depende de si el mensaje indica un problema:
Si el mensaje denota un problema, corríjalo del modo que se explica en Cómo recuperarse de un error del daemon ucmmd o de un componente relacionado.
Si el mensaje no indica ningún problema, no se debe realizar ninguna acción.
Descripción: La reconfiguración de Oracle RAC no se completó hasta después de que hubiera finalizado el tiempo de espera del método START del recurso SUNW.rac_framework.
Solución: Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de la finalización de tiempo de espera del método START.
Los mensajes de estado siguientes se asocian con el error de un recurso SUNW.vucmm_framework al iniciarse:
Faulted - vucmmd is not running
Descripción: El daemon vucmmd no se ejecuta en el nodo en que reside el recurso.
Solución: Para obtener información sobre cómo corregir este problema, consulte Error del daemon vucmmd al iniciarse.
Degraded - reconfiguration in progress
Descripción: La estructura de administrador de volúmenes de múltiples propietarios se está reconfigurando. Este mensaje denota un problema sólo si no se ha completado la reconfiguración de la estructura de administrador de volúmenes de múltiples propietarios y si este recurso mantiene permanentemente el estado de degradado.
Causa: Si este mensaje denota un problema, la causa es un error de configuración en uno o más componentes de la estructura de administrador de volúmenes de múltiples propietarios.
Solución: La solución de este problema depende de si el mensaje indica un problema:
Si el mensaje denota un problema, corríjalo del modo que se explica en Cómo recuperarse de un error del daemon vucmmd o de un componente relacionado.
Si el mensaje no indica ningún problema, no se debe realizar ninguna acción.
Descripción: La reconfiguración de Oracle RAC no se completó hasta después de haber finalizado el tiempo de espera del método START del recurso SUNW.vucmm_framework.
Solución: Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de la finalización de tiempo de espera del método START.
Para llevar a cabo esta operación, cambie los nodos principales del grupo de recursos por los otros nodos en que el grupo está en línea.
# clresourcegroup offline -n nodelist resource-group
Especifica una lista separada por comas de otros nodos de clúster en que grupo_recursos está en línea. Omita de esta lista el nodo en que finalizó el tiempo de espera del método START.
Especifica el nombre del grupo de recursos de estructura.
Si la configuración utiliza un grupo de recursos de estructura de múltiples propietarios y un grupo de recursos de estructura de RAC, en primer lugar ponga fuera de línea el grupo de recursos de estructura de múltiples propietarios. Si el grupo de recursos de estructura de múltiples propietarios está fuera de línea, ponga fuera de línea el grupo de recursos de estructura de RAC.
Si este grupo de recursos de RAC se creó con la utilidad clsetup, el nombre del grupo de recursos es rac-framework-rg.
# clresourcegroup online resource-group
Especifica que el grupo de recursos que se puso fuera de línea en el Paso 2 va a tener el estado MANAGED y a estar en línea.
Si un recurso no se puede detener, corrija este problema como se ha explicado en Clearing the STOP_FAILED Error Flag on Resources de Oracle Solaris Cluster Data Services Planning and Administration Guide.