Problemas habituales y soluciones

En las subsecciones siguientes se describen problemas que pueden afectar a Admisión de Oracle RAC. Cada subsección brinda información relativa a la causa del problema, así como una solución.

Error de un grupo de recursos de estructura de RAC
Error de un grupo de recursos de estructura de administrador de volúmenes de múltiples propietarios
Error al registrar SUNW.qfs porque no se puede encontrar el archivo de registro
Error grave de nodo debido a un tiempo de espera
Error de un recurso SUNW.rac_framework o SUNW.vucmm_framework al iniciarse
Mensajes de estado de error al iniciarse de SUNW.rac_framework
Mensajes de estado de error al iniciarse de SUNW.vucmm_framework
Cómo recuperarse de la finalización de tiempo de espera del método START
Error de un recurso al detenerse

Error de un grupo de recursos de estructura de RAC

En esta sección, se describen problemas que pueden afectar al grupo de recursos de estructuras de RAC.

Error grave de nodo al inicializar Admisión de Oracle RAC
Error del daemon ucmmd al iniciarse
Cómo recuperarse de un error del daemon ucmmd o de un componente relacionado

Error grave de nodo al inicializar Admisión de Oracle RAC

Si se da un problema fatal al inicializar Admisión de Oracle RAC, el nodo genera una situación de error grave con mensajes de error similares al siguiente:

panic[cpu0]/thread=40037e60: Failfast: Aborting because "ucmmd" died 30 seconds ago

Descripción: Un componente controlado por el UCMM ha devuelto un error al UCMM durante una reconfiguración.

Causa: Las causas más habituales de este problema son las siguientes:

SPARC: El paquete ORCLudlm que contiene el Oracle UDLM no está instalado.
SPARC: La versión de Oracle UDLM y la de Admisión de Oracle RAC son incompatibles.
SPARC: Oracle UDLM no se puede iniciar con la cantidad de memoria compartida disponible.

Un nodo también puede entrar en una situación de error grave al inicializar Admisión de Oracle RAC si finaliza el tiempo de espera asignado al paso de reconfiguración. Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera.

Solución: Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un error del daemon ucmmd o de un componente relacionado.

Nota - En el caso de un nodo de votación de clúster global de clúster global, el error grave del nodo repercute negativamente en toda la máquina. En el caso de un nodo de clúster de zona, el error grave del nodo afecta negativamente sólo a esa zona.

Error del daemon `ucmmd` al iniciarse

El daemon de UCMM, ucmmd, se encarga de la reconfiguración de Admisión de Oracle RAC. Al arrancar o rearrancar un clúster, este daemon se inicia únicamente después de haberse validado todos los componentes de Admisión de Oracle RAC. Si falla la validación de un componente, el daemon ucmmd no se llega a iniciar en el nodo.

Las causas más habituales de este problema son las siguientes:

SPARC: El paquete ORCLudlm que contiene el Oracle UDLM no está instalado.
Hubo un error durante la reconfiguración anterior de un componente de Admisión de Oracle RAC.
Finalizó el tiempo de espera de un paso en una reconfiguración anterior de Admisión de Oracle RAC, lo que hizo que el nodo donde terminó el tiempo de espera pasara a una situación de error grave.

Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un error del daemon ucmmd o de un componente relacionado.

Cómo recuperarse de un error del daemon `ucmmd` o de un componente relacionado

Efectúe esta tarea para corregir los problemas que se describen en las secciones siguientes:

Error grave de nodo al inicializar Admisión de Oracle RAC
Error del daemon ucmmd al iniciarse

Para determinar la causa del problema, examine los archivos de registro de las reconfiguraciones de UCMM y el archivo de mensajes del sistema.
Si necesita saber las ubicaciones de los archivos de registro de las reconfiguraciones de UCMM, consulte Fuentes de información de diagnóstico.
Al examinar estos archivos, comience por el mensaje más reciente y vaya retrocediendo hasta identificar la causa del problema.
Para obtener más información sobre mensajes de error que pudieran indicar la causa de errores de reconfiguración, consulte Oracle Solaris Cluster Error Messages Guide.
Corrija el problema que hizo que el componente devolviera un error a UCMM.
Por ejemplo:
- SPARC: Si la versión de Oracle que se utiliza necesita Oracle UDLM y el paquete ORCLudlm que contiene Oracle UDLM no está instalado, asegúrese de que esté instalado el paquete.
  Nota - Oracle UDLM se necesita sólo cuando se utiliza.
  1. Compruebe que haya completado todos los procedimientos previos a la instalación y la configuración de Oracle UDLM.
    Los procedimientos que se deben completar figuran en la Tabla 1-1.
  2. Compruebe que Oracle UDLM esté correctamente instalado y configurado.
    Para obtener más información, consulte SPARC: Instalación de Oracle UDLM.
- SPARC: Si Oracle UDLM y Admisión de Oracle RAC tienen versiones incompatibles, instale una versión compatible del paquete.
  Para obtener más información, consulte SPARC: Instalación de Oracle UDLM.
- SPARC: Si la cantidad de memoria compartida es insuficiente para que Oracle UDLM se pueda iniciar, aumente la cantidad de memoria compartida.
  Para obtener más información, consulte Cómo configurar la memoria compartida para Oracle RAC en el clúster global.
- Si ha finalizado el tiempo de espera de un paso de reconfiguración, incremente el valor de la propiedad de extensión que especifica el tiempo de espera relativo al paso.
  Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera.
Si la solución del problema consiste en rearrancar, rearranque el nodo cuando tenga lugar el problema.
Rearrancar es la solución únicamente de determinados problemas. Por ejemplo, el aumento de memoria compartida precisa rearrancar. Sin embargo, incrementar el tiempo de espera de un paso no requiere rearrancar.
Para obtener más información sobre cómo rearrancar un nodo, consulte Cierre y arranque de un solo nodo de un clúster de Guía de administración del sistema de Oracle Solaris Cluster.
En el nodo donde tuvo lugar el problema, ponga fuera de línea el grupo de recursos de estructura de RAC y colóquelo en línea de nuevo.
Este paso actualiza el grupo de recursos con los cambios en la configuración que ha efectuado.
1. Conviértase en superusuario o asuma una función que proporcione autorización de RBAC solaris.cluster.admin.
2. Escriba el comando para poner fuera de línea el grupo de recursos de estructura de RAC y sus recursos.
```
# clresourcegroup offline -n node rac-fmwk-rg
```
  -n nodo
  
  Especifica el nombre o el identificador de nodo (ID) del nodo donde se dio el problema.
  
  gr_estruct_rac
  
  Especifica el nombre del grupo de recursos que se va a poner fuera de línea.
3. Escriba el comando para colocar en línea y en estado administrado (managed) el grupo de recursos de estructura de RAC y sus recursos.
```
# clresourcegroup online -emM -n node rac-fmwk-rg
```

Error de un grupo de recursos de estructura de administrador de volúmenes de múltiples propietarios

En esta sección, se describen problemas que pueden afectar al grupo de recursos de estructura de administrador de volúmenes de múltiples propietarios.

Error grave de nodo al inicializar la estructura de administrador de volúmenes de múltiples propietarios
Error del daemon vucmmd al iniciarse
Cómo recuperarse de un error del daemon vucmmd o de un componente relacionado

Error grave de nodo al inicializar la estructura de administrador de volúmenes de múltiples propietarios

Si se da un problema fatal al inicializar la estructura de administrador de volúmenes de múltiples propietarios, el nodo genera una situación de error grave con mensajes de error similares al siguiente:

Nota - En el caso de un nodo de votación de clúster global del clúster global, el error grave del nodo repercute negativamente en toda la máquina.

panic[cpu0]/thread=40037e60: Failfast: Aborting because "vucmmd" died 30 seconds ago

Descripción: Un componente controlado por la estructura de administrador de volúmenes de múltiples propietarios ha devuelto un mensaje de error a dicha estructura durante una reconfiguración.

Causa: Las causas más habituales de este problema son que Veritas Volume Manager (VxVM) carece de licencia o que la licencia está caducada.

Un nodo también puede entrar en una situación de error grave al inicializar la estructura de administrador de volúmenes de múltiples propietarios al finalizar el tiempo de espera asignado al paso de reconfiguración. Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera.

Solución: Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un error del daemon vucmmd o de un componente relacionado.

Error del daemon `vucmmd` al iniciarse

El daemon vucmmd de la estructura de administrador de volúmenes de múltiples propietarios se encarga de reconfigurar dicha estructura. Al arrancar o rearrancar un clúster, este daemon se inicia únicamente después de haberse validado todos los componentes de la estructura de administrador de volúmenes de múltiples propietarios. Si falla la validación de un componente en un nodo, el daemon vucmmd no se llega a iniciar en el nodo.

Las causas más habituales de este problema son las siguientes:

Hubo un error durante la reconfiguración anterior de un componente de la estructura de administrador de volúmenes de múltiples propietarios.
Finalizó el tiempo de espera de un paso en una reconfiguración anterior de la estructura de administrador de volúmenes de múltiples propietarios, cosa que hizo que el nodo donde terminó el tiempo de espera pasara a una situación de error grave.

Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un error del daemon vucmmd o de un componente relacionado.

Cómo recuperarse de un error del daemon `vucmmd` o de un componente relacionado

Efectúe esta tarea para corregir los problemas que se describen en las secciones siguientes:

Error grave de nodo al inicializar la estructura de administrador de volúmenes de múltiples propietarios
Error del daemon vucmmd al iniciarse

Para determinar la causa del problema, examine los archivos de registro de las reconfiguraciones de la estructura de administrador de volúmenes de múltiples propietarios y el archivo de mensajes del sistema.
Si necesita saber las ubicaciones de los archivos de registro de las reconfiguraciones de la estructura de administrador de volúmenes de múltiples propietarios, consulte Fuentes de información de diagnóstico.
Al examinar estos archivos, comience por el mensaje más reciente y vaya retrocediendo hasta identificar la causa del problema.
Para obtener más información sobre mensajes de error que pudieran indicar la causa de errores de reconfiguración, consulte Oracle Solaris Cluster Error Messages Guide.
Corrija el problema que hizo que el componente devolviera un error a la estructura de administrador de volúmenes de múltiples propietarios.
Por ejemplo:
- Si se carece de licencia para VxVM o ha caducado, asegúrese de que VxVM esté bien instalado y de que cuente con la correspondiente licencia.
  1. Compruebe que haya instalado correctamente los paquetes del administrador de volúmenes.
  2. Si se utiliza VxVM, asegúrese de haber instalado el software y de que la licencia para la función de clúster de VxVM sea válida.
  Nota - Un clúster de zona no admite VxVM.
- Si ha finalizado el tiempo de espera de un paso de reconfiguración, incremente el valor de la propiedad de extensión que especifica el tiempo de espera relativo al paso.
  Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera.
Si la solución del problema consiste en rearrancar, rearranque el nodo cuando tenga lugar el problema.
Rearrancar es la solución únicamente de determinados problemas. Por ejemplo, el aumento de memoria compartida precisa rearrancar. Sin embargo, incrementar el tiempo de espera de un paso no requiere rearrancar.
Para obtener más información sobre cómo rearrancar un nodo, consulte Cierre y arranque de un solo nodo de un clúster de Guía de administración del sistema de Oracle Solaris Cluster.
En el nodo donde tuvo lugar el problema, ponga fuera de línea la estructura de administrador de volúmenes de múltiples propietarios y colóquela en línea de nuevo.
Este paso actualiza el grupo de recursos con los cambios en la configuración que ha efectuado.
1. Conviértase en superusuario o asuma una función que proporcione autorización de RBAC solaris.cluster.admin.
2. Escriba el comando para poner fuera de línea la estructura de administrador de volúmenes de múltiples propietarios y sus recursos.
```
# clresourcegroup offline -n node vucmm-fmwk-rg
```
  -n nodo
  
  Especifica el nombre o el identificador de nodo (ID) del nodo donde se dio el problema.
  
  gr_estruct_vucmm
  
  Especifica el nombre del grupo de recursos que se va a poner fuera de línea.
3. Escriba el comando para colocar en línea y en estado administrado (managed) el grupo de recursos de estructura de RAC y sus recursos.
```
# clresourcegroup online -emM -n node vucmm-fmwk-rg
```

Error al registrar SUNW.qfs porque no se puede encontrar el archivo de registro

Los archivos de registro de tipo de recurso de Oracle Solaris Cluster se ubican en el directorio /opt/cluster/lib/rgm/rtreg/ or /usr/cluster/lib/rgm/rtreg/. El archivo de registro de tipo de recurso de SUNW.qfs se ubica en el directorio /opt/SUNWsamfs/sc/etc/.

Si Oracle Solaris Cluster ya está instalado al instalar Sun QFS, de manera automática se crea la correspondiente asignación al archivo de registro SUNW.qfs. Sin embargo, si Oracle Solaris Cluster no está instalado todavía al instalar Sun QFS, no se efectúa la pertinente asignación al archivo de registro SUNW.qfs, ni siquiera si posteriormente se instala Sun Cluster. Por lo tanto, los intentos de registrar el tipo de recurso SUNW.qfs fallan debido a que Oracle Solaris Cluster desconoce la ubicación de su archivo de registro.

Para que Oracle Solaris Cluster pueda encontrar el tipo de recurso SUNW.qfs, cree un vínculo simbólico con el directorio:

# cd /usr/cluster/lib/rgm/rtreg
# ln -s /opt/SUNWsamfs/sc/etc/SUNW.qfs SUNW.qfs

Error grave de nodo debido a un tiempo de espera

La finalización del tiempo de espera de cualquier paso en la reconfiguración de Admisión de Oracle RAC hace que el nodo donde se ha dado la finalización del tiempo de espera pase a un estado de error grave.

Para prevenir la finalización del tiempo de espera en los pasos de reconfiguración, ajuste los tiempos de espera que dependan de la configuración de clústers. Para obtener más información, consulte Directrices para configurar tiempos de espera.

Si finaliza el tiempo de espera de un paso de reconfiguración, utilice los comandos de mantenimiento de Oracle Solaris Cluster para incrementar el valor de la propiedad de extensión que especifica el tiempo de espera relativo al paso. Para obtener más información, consulte el Apéndice CPropiedades de extensión de Admisión de Oracle RAC.

Después de haber incrementado el valor de la propiedad de extensión, coloque en línea el grupo de recursos de estructura de RAC en el nodo que estaba en situación de error grave.

Error de un recurso `SUNW.rac_framework` o `SUNW.vucmm_framework` al iniciarse

Si no se inicia un recurso SUNW.rac_framework o SUNW.vucmm_framework, compruebe el estado del recurso para determinar la causa del error. Para obtener más información, consulte Cómo verificar el estado de Admisión de Oracle RAC.

El estado de un recurso que no logra iniciarse se muestra como Start failed. El mensaje de estado asociado indica la causa del error al iniciarse.

Esta sección contiene la información siguiente:

Mensajes de estado de error al iniciarse de `SUNW.rac_framework`

Los mensajes de estado siguientes se asocian con el error de un recurso SUNW.rac_framework al iniciarse:

Faulted - ucmmd is not running

Descripción: El daemon ucmmd no se ejecuta en el nodo en que reside el recurso.

Solución: Para obtener información sobre cómo corregir este problema, consulte Error del daemon ucmmd al iniciarse.

Degraded - reconfiguration in progress

Descripción: El UCMM se está reconfigurando. Este mensaje denota un problema sólo si no se ha completado la reconfiguración del UCMM y si este recurso mantiene permanentemente el estado de degradado.

Causa: Si este mensaje denota un problema, la causa es un error de configuración en uno o más componentes de Admisión de Oracle RAC.

Solución: La solución de este problema depende de si el mensaje indica un problema:

Si el mensaje denota un problema, corríjalo del modo que se explica en Cómo recuperarse de un error del daemon ucmmd o de un componente relacionado.
Si el mensaje no indica ningún problema, no se debe realizar ninguna acción.

Online

Descripción: La reconfiguración de Oracle RAC no se completó hasta después de que hubiera finalizado el tiempo de espera del método START del recurso SUNW.rac_framework.

Solución: Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de la finalización de tiempo de espera del método START.

Mensajes de estado de error al iniciarse de `SUNW.vucmm_framework`

Los mensajes de estado siguientes se asocian con el error de un recurso SUNW.vucmm_framework al iniciarse:

Faulted - vucmmd is not running

Descripción: El daemon vucmmd no se ejecuta en el nodo en que reside el recurso.

Solución: Para obtener información sobre cómo corregir este problema, consulte Error del daemon vucmmd al iniciarse.

Degraded - reconfiguration in progress

Descripción: La estructura de administrador de volúmenes de múltiples propietarios se está reconfigurando. Este mensaje denota un problema sólo si no se ha completado la reconfiguración de la estructura de administrador de volúmenes de múltiples propietarios y si este recurso mantiene permanentemente el estado de degradado.

Causa: Si este mensaje denota un problema, la causa es un error de configuración en uno o más componentes de la estructura de administrador de volúmenes de múltiples propietarios.

Solución: La solución de este problema depende de si el mensaje indica un problema:

Si el mensaje denota un problema, corríjalo del modo que se explica en Cómo recuperarse de un error del daemon vucmmd o de un componente relacionado.
Si el mensaje no indica ningún problema, no se debe realizar ninguna acción.

Online

Descripción: La reconfiguración de Oracle RAC no se completó hasta después de haber finalizado el tiempo de espera del método START del recurso SUNW.vucmm_framework.

Solución: Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de la finalización de tiempo de espera del método START.

Cómo recuperarse de la finalización de tiempo de espera del método `START`

Conviértase en superusuario o asuma una función que proporcione la autorización de RBAC solaris.cluster.admin.
En el nodo donde ha finalizado el tiempo de espera del método START, ponga fuera de línea el grupo de recursos de estructura que no ha podido iniciarse.
Para llevar a cabo esta operación, cambie los nodos principales del grupo de recursos por los otros nodos en que el grupo está en línea.
```
# clresourcegroup offline -n nodelist resource-group
```
-n lista_nodos

Especifica una lista separada por comas de otros nodos de clúster en que grupo_recursos está en línea. Omita de esta lista el nodo en que finalizó el tiempo de espera del método START.

grupo_recursos

Especifica el nombre del grupo de recursos de estructura.
Si la configuración utiliza un grupo de recursos de estructura de múltiples propietarios y un grupo de recursos de estructura de RAC, en primer lugar ponga fuera de línea el grupo de recursos de estructura de múltiples propietarios. Si el grupo de recursos de estructura de múltiples propietarios está fuera de línea, ponga fuera de línea el grupo de recursos de estructura de RAC.
Si este grupo de recursos de RAC se creó con la utilidad clsetup, el nombre del grupo de recursos es rac-framework-rg.
En todos los nodos que puedan ejecutar Admisión de Oracle RAC, ponga en línea el grupo de recursos de estructura que no se pudo poner en línea.
```
# clresourcegroup online resource-group
```
grupo_recursos

Especifica que el grupo de recursos que se puso fuera de línea en el Paso 2 va a tener el estado MANAGED y a estar en línea.

Error de un recurso al detenerse

Si un recurso no se puede detener, corrija este problema como se ha explicado en Clearing the STOP_FAILED Error Flag on Resources de Oracle Solaris Cluster Data Services Planning and Administration Guide.

Omitir Vínculos de navegación
Salir de la Vista de impresión
	Guía del servicio de datos de Oracle Solaris Cluster para Oracle Real Application Clusters (RAC)

Problemas habituales y soluciones

Error de un grupo de recursos de estructura de RAC

Error grave de nodo al inicializar Admisión de Oracle RAC

Error del daemon ucmmd al iniciarse

Cómo recuperarse de un error del daemon ucmmd o de un componente relacionado

Error de un grupo de recursos de estructura de administrador de volúmenes de múltiples propietarios

Error grave de nodo al inicializar la estructura de administrador de volúmenes de múltiples propietarios

Error del daemon vucmmd al iniciarse

Cómo recuperarse de un error del daemon vucmmd o de un componente relacionado