Problemas comunes y sus soluciones

En las subsecciones siguientes, se describen problemas que pueden afectar a Soporte para Oracle RAC. Cada subsección brinda información relativa a la causa del problema, así como una solución.

Fallo de un grupo de recursos de estructura de Oracle RAC
Fallo de un grupo de recursos de estructura de gestor de volúmenes de múltiples propietarios
El registro de SUNW.qfs falla porque el archivo de registro no se encuentra
Error grave de nodo debido a un tiempo de espera finalizado
Fallo de un recurso SUNW.rac_framework o SUNW.vucmm_framework al iniciar
Mensajes de estado de fallo al iniciar SUNW.rac_framework
Mensajes de estado de fallo al iniciar SUNW.vucmm_framework
Cómo recuperarse de la finalización del tiempo de espera del método START
Fallo de un recurso al detenerse

Fallo de un grupo de recursos de estructura de Oracle RAC

En esta sección, se describen problemas que pueden afectar el grupo de recursos de estructura de Oracle RAC.

Error grave del nodo al inicializar Soporte para Oracle RAC
Fallo del daemon ucmmd al iniciarse
Cómo recuperarse de un fallo del daemon ucmmd o de un componente relacionado

Error grave del nodo al inicializar Soporte para Oracle RAC

Si ocurre un problema fatal al inicializar Soporte para Oracle RAC, el nodo genera un mensaje de aviso grave similar al siguiente mensaje de error:

panic[cpu0]/thread=40037e60: Failfast: Aborting because "ucmmd" died 30 seconds ago

Descripción: un componente controlado por el UCMM ha devuelto un error al UCMM durante una reconfiguración.

Causa: las causas más habituales de este problema son las siguientes:

SPARC: El paquete ORCLudlm que contiene UDLM no está instalado.
SPARC: La versión de UDLM no es compatible con la versión de Soporte para Oracle RAC.
SPARC: La cantidad de memoria compartida no es suficiente para activar UDLM para que se inicie.

Un nodo también puede generar un mensaje de aviso grave al inicializar Soporte para Oracle RAC porque se ha finalizado el tiempo de espera asignado al paso de reconfiguración. Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera finalizado.

Solución: Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un fallo del daemon ucmmd o de un componente relacionado.

Nota - Cuando el nodo es un nodo de votación de cluster global, el error grave del nodo interrumpe el equipo entero. Cuando el nodo es un nodo de cluster de zona, el error grave del nodo sólo interrumpe esa zona específica y las demás zonas no son afectadas.

Fallo del daemon `ucmmd` al iniciarse

El daemon de UCMM, ucmmd, se encarga de la reconfiguración de Soporte para Oracle RAC. Cuando un cluster se inicia o se reinicia, este daemon se inicia únicamente después de que se validan todos los componentes de Soporte para Oracle RAC. Si la validación de un componente en un nodo falla, el daemon ucmmd no se inicia en el nodo.

Las causas más habituales de este problema son las siguientes:

SPARC: El paquete ORCLudlm que contiene UDLM no está instalado.
Se ha producido un error durante la reconfiguración anterior de un componente de Soporte para Oracle RAC.
Un paso en una reconfiguración anterior de Soporte para Oracle RAC superó el tiempo de espera, lo que generó un error grave en el nodo donde terminó el tiempo de espera.

si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un fallo del daemon ucmmd o de un componente relacionado.

Cómo recuperarse de un fallo del daemon `ucmmd` o de un componente relacionado

Realice esta tarea para corregir los problemas que se describen en las siguientes secciones:

Error grave del nodo al inicializar Soporte para Oracle RAC
Fallo del daemon ucmmd al iniciarse

Para determinar la causa del problema, examine los archivos de registro de las reconfiguraciones de UCMM y el archivo de mensajes del sistema.
Para la ubicación de los archivos de registro de las reconfiguraciones de UCMM, consulte Fuentes de información de diagnóstico.
Al examinar estos archivos, comience por el mensaje más reciente y vaya retrocediendo hasta identificar la causa del problema.
Para obtener más información sobre los mensajes de error que pudieran indicar la causa de errores de reconfiguración, consulte la Oracle Solaris Cluster Error Messages Guide.
Corrija el problema que hizo que el componente devolviera un error al UCMM.
Por ejemplo:
- SPARC: Si la versión de Oracle requiere UDLM y el paquete ORCLudlm que contiene el UDLM no está instalado, asegúrese de que el paquete esté instalado.
  Nota - UDLM se requiere solamente cuando se utiliza.
  1. Asegúrese de haber completado todos los procedimientos que preceden a la instalación y la configuración del software UDLM.
    Los procedimientos que debe completar se muestran en Tabla 1-1.
  2. Compruebe que UDLM esté correctamente instalado y configurado.
    Para obtener más información, consulte SPARC: Instalación de UDLM.
- SPARC: Si UDLM y Soporte para Oracle RAC tienen versiones incompatibles, instale una versión compatible del paquete.
  Para obtener más información, consulte SPARC: Instalación de UDLM.
- SPARC: Si la cantidad de memoria compartida no es suficiente para permitir que UDLM se inicie, aumente la cantidad de memoria compartida.
  Para obtener más información, consulte Cómo configurar la memoria compartida para el software de Oracle RAC en el cluster global.
- Si se ha agotado el tiempo de espera asignado al paso de reconfiguración, aumente el valor de la propiedad de extensión que especifica el tiempo de espera relativo al paso.
  Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera finalizado.
Si la solución del problema consiste en reiniciar, reinicie el nodo en donde ocurrió el problema.
Únicamente la solución a determinados problemas requiere un reinicio. Por ejemplo, el aumento de memoria compartida requiere un reinicio. Sin embargo, el aumento del valor del tiempo de espera de un paso no requiere un reinicio.
Para obtener más información sobre el reinicio de un nodo, consulte Cierre y arranque de un solo nodo de un clúster de Guía de administración del sistema de Oracle Solaris Cluster.
En el nodo donde ocurrió el problema, ponga fuera de línea y ponga en línea el grupo de recursos de estructura de Oracle RAC.
Este paso actualiza el grupo de recursos con los cambios en la configuración que ha efectuado.
1. Conviértase en superusuario o asuma una función que proporcione la autorización de RBAC solaris.cluster.admin.
2. Escriba el comando para poner fuera de línea el grupo de recursos de estructura de Oracle RAC y sus recursos.
```
# clresourcegroup offline -n node rac-fmwk-rg
```
  -n node
  
  Especifica el nombre o el identificador de nodo (ID) del nodo donde ocurrió el problema.
  
  rac-fmwk-rg
  
  Especifica el nombre del grupo de recursos que se va a poner fuera de línea.
3. Escriba el comando para poner en línea y en estado gestionado el grupo de recursos de estructura de Oracle RAC y sus recursos.
```
# clresourcegroup online -emM -n node rac-fmwk-rg
```

Fallo de un grupo de recursos de estructura de gestor de volúmenes de múltiples propietarios

En esta sección, se describen problemas que pueden afectar el grupo de recursos de estructura de gestor de volúmenes de múltiples propietarios.

Error grave de nodo al inicializar la estructura del gestor de volúmenes de múltiples propietarios
Fallo del daemon vucmmd al iniciarse
Cómo recuperarse de un fallo del daemon vucmmd o de un componente relacionado

Error grave de nodo al inicializar la estructura del gestor de volúmenes de múltiples propietarios

Si ocurre un problema fatal durante la inicialización de la estructura del gestor de volúmenes de múltiples propietarios, el nodo genera un mensaje de aviso grave similar al siguiente mensaje de error:

Nota - Cuando el nodo es un nodo de votación de cluster global, el error grave del nodo interrumpe el equipo entero.

panic[cpu0]/thread=40037e60: Failfast: Aborting because "vucmmd" died 30 seconds ago

Descripción: un componente que controla la estructura del administrador de volúmenes de múltiples propietarios ha devuelto un error a la estructura del administrador de volúmenes de múltiples propietarios durante una reconfiguración.

Causa: las causas más habituales de este problema es que falta o caducó la licencia de Veritas Volume Manager (VxVM).

También es posible que un nodo tenga una situación crítica al inicializar la estructura del administrador de volúmenes de múltiples propietarios porque un paso de reconfiguración ha sufrido un tiempo de espera. Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera finalizado.

Solución: si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un fallo del daemon vucmmd o de un componente relacionado.

Fallo del daemon `vucmmd` al iniciarse

El daemon de la estructura del gestor de volúmenes de múltiples propietarios, vucmmd, gestiona la reconfiguración de la estructura del gestor de volúmenes de múltiples propietarios. Al iniciar o reiniciar un cluster, este daemon se inicia únicamente después de que se validan todos los componentes de la estructura del gestor de volúmenes de múltiples propietarios. Si la validación de un componente en un nodo falla, el daemon vucmmd no se inicia en el nodo.

Las causas más habituales de este problema son las siguientes:

Se ha producido un error durante una reconfiguración anterior de un componente de la estructura del gestor de volúmenes de múltiples propietarios.
Un paso en una reconfiguración anterior de la estructura del gestor de volúmenes de múltiples propietarios superó el tiempo de espera, lo que generó un error grave en el nodo donde terminó el tiempo de espera.

Si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de un fallo del daemon vucmmd o de un componente relacionado.

Cómo recuperarse de un fallo del daemon `vucmmd` o de un componente relacionado

Realice esta tarea para corregir los problemas que se describen en las siguientes secciones:

Error grave de nodo al inicializar la estructura del gestor de volúmenes de múltiples propietarios
Fallo del daemon vucmmd al iniciarse

Para determinar la causa del problema, examine los archivos de registro de las reconfiguraciones de la estructura del gestor de volúmenes de múltiples propietarios y el archivo de mensajes del sistema.
Para conocer la ubicación de los archivos de registro de las reconfiguraciones de la estructura del gestor de volúmenes de múltiples propietarios, consulte Fuentes de información de diagnóstico.
Al examinar estos archivos, comience por el mensaje más reciente y vaya retrocediendo hasta identificar la causa del problema.
Para obtener más información sobre los mensajes de error que pudieran indicar la causa de errores de reconfiguración, consulte la Oracle Solaris Cluster Error Messages Guide.
Corrija el problema que hizo que el componente devolviera un error a la estructura de gestión de volúmenes de múltiples propietarios.
Por ejemplo:
- Si la licencia para VxVM falta o ha caducado, asegúrese de que VxVM esté instalado correctamente y disponga de licencia.
  1. Compruebe que haya instalado correctamente los paquetes del administrador de volúmenes.
  2. Si está utilizando VxVM, compruebe que haya instalado el software y compruebe que la licencia para la función de cluster de VxVM sea válida.
  Nota - Un cluster de zona no admite VxVM.
- Si se ha agotado el tiempo de espera asignado al paso de reconfiguración, aumente el valor de la propiedad de extensión que especifica el tiempo de espera relativo al paso.
  Para obtener más información, consulte Error grave de nodo debido a un tiempo de espera finalizado.
Si la solución del problema consiste en reiniciar, reinicie el nodo en donde ocurrió el problema.
Únicamente la solución a determinados problemas requiere un reinicio. Por ejemplo, el aumento de memoria compartida requiere un reinicio. Sin embargo, el aumento del valor del tiempo de espera de un paso no requiere un reinicio.
Para obtener más información sobre el reinicio de un nodo, consulte Cierre y arranque de un solo nodo de un clúster de Guía de administración del sistema de Oracle Solaris Cluster.
En el nodo donde ocurrió el problema, ponga fuera de línea y ponga en línea el grupo de recursos de la estructura del gestor de volúmenes de múltiples destinatarios.
Este paso actualiza el grupo de recursos con los cambios en la configuración que ha efectuado.
1. Conviértase en superusuario o asuma una función que proporcione la autorización de RBAC solaris.cluster.admin.
2. Escriba el comando para poner fuera de línea el grupo de recursos de la estructura del gestor de volúmenes de múltiples propietarios y sus recursos.
```
# clresourcegroup offline -n node vucmm-fmwk-rg
```
  -n node
  
  Especifica el nombre o el identificador de nodo (ID) del nodo donde ocurrió el problema.
  
  vucmm-fmwk-rg
  
  Especifica el nombre del grupo de recursos que se va a poner fuera de línea.
3. Escriba el comando para poner en línea y en estado gestionado el grupo de recursos de la estructura del gestor de volúmenes de múltiples propietarios y sus recursos.
```
# clresourcegroup online -emM -n node vucmm-fmwk-rg
```

El registro de SUNW.qfs falla porque el archivo de registro no se encuentra

Los archivos de registro del tipo de recurso de Oracle Solaris Cluster están en el directorio /opt/cluster/lib/rgm/rtreg/ o /usr/cluster/lib/rgm/rtreg/. El archivo de registro del tipo de recurso SUNW.qfs se encuentra en el directorio /opt/SUNWsamfs/sc/etc/.

Si el software Oracle Solaris Cluster ya está instalado al instalar el software de software Sun QFS, la asignación necesaria para el archivo de registro SUNW.qfs se crea automáticamente. Pero si el software Oracle Solaris Cluster no está instalado al instalar el software Sun QFS, la asignación necesaria para el archivo de registro SUNW.qfs se realiza, incluso cuando el software Sun Cluster se instale más tarde. Intenta registrar el tipo de recurso SUNW.qfs, por lo tanto, falla por que el software Oracle Solaris Cluster no conoce la ubicación de su archivo de registro.

Para permitir que el software Oracle Solaris Cluster ubique el tipo de recurso SUNW.qfs, cree un enlace al directorio:

# cd /usr/cluster/lib/rgm/rtreg
# ln -s /opt/SUNWsamfs/sc/etc/SUNW.qfs SUNW.qfs

Error grave de nodo debido a un tiempo de espera finalizado

La finalización del tiempo de espera de cualquier paso en la reconfiguración de Soporte para Oracle RAC hace que se genere un error grave en el nodo donde terminó el tiempo de espera.

Para evitar que se termine el tiempo de espera de los pasos de reconfiguración, ajuste los tiempos de espera que dependen de la configuración del cluster. Para obtener más información, consulte Directrices para configurar tiempos de espera.

Si finaliza el tiempo de espera de un paso de reconfiguración, utilice los comandos de mantenimiento de Oracle Solaris Cluster para aumentar el valor de la propiedad de extensión que especifica el tiempo de espera para el paso. Para obtener más información, consulte el Apéndice CPropiedades de extensión de Soporte para Oracle RAC.

Después de haber aumentado el valor de la propiedad de extensión, ponga en línea el grupo de recursos de estructura de Oracle RAC en el nodo donde se generó el error grave.

Fallo de un recurso `SUNW.rac_framework` o `SUNW.vucmm_framework` al iniciar

Si el recurso SUNW.rac_framework o SUNW.vucmm_framework no se inicia, compruebe el estado del recurso para determinar la causa del fallo. Para obtener más información, consulte Cómo verificar el estado de Soporte para Oracle RAC.

El estado de un recurso que no se pudo iniciar se muestra como Start failed. El mensaje de estado asociado indica la causa del fallo al iniciar.

Esta sección contiene la siguiente información:

Mensajes de estado de fallo al iniciar `SUNW.rac_framework`

Los siguientes mensajes de estado están asociados con el fallo de un recurso SUNW.rac_framework al iniciar:

Faulted - ucmmd is not running

Descripción: el daemon ucmmd no se está ejecutando en el nodo donde reside el recurso.

Solución: para obtener información sobre la corrección de este problema, consulte Fallo del daemon ucmmd al iniciarse.

Degraded - reconfiguration in progress

Descripción: El UCMM se está reconfigurando. Este mensaje indica un problema sólo si la reconfiguración del UCMM no se completa y el estado de este recurso sigue siendo degradado.

Causa: si este mensaje indica un problema, la causa del fallo es un error de configuración en uno o más componentes de Soporte para Oracle RAC.

Solución: la solución de este problema depende de si el mensaje indica un problema:

Si el mensaje indica un problema, corríjalo del modo que se explica en Cómo recuperarse de un fallo del daemon ucmmd o de un componente relacionado.
Si el mensaje no indica ningún problema, no se requiere ninguna acción.

En línea

Descripción: la reconfiguración de Oracle RAC no se completó hasta que finalizó el tiempo de espera del método START del recurso SUNW.rac_framework.

Solución: si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de la finalización del tiempo de espera del método START.

Mensajes de estado de fallo al iniciar `SUNW.vucmm_framework`

Los siguientes mensajes de estado están asociados con el fallo de un recurso SUNW.vucmm_framework al iniciar:

Faulted - vucmmd is not running

Descripción: el daemon vucmmd no se está ejecutando en el nodo donde reside el recurso.

Solución: para obtener información sobre cómo corregir este problema, consulte Fallo del daemon vucmmd al iniciarse.

Degraded - reconfiguration in progress

Descripción: la estructura del gestor de volúmenes de múltiples propietarios se está reconfigurando. Este mensaje indica un problema sólo si la reconfiguración de la estructura del gestor de volúmenes de múltiples propietarios no se completa y el estado de este recurso sigue siendo degradado.

Causa: si este mensaje indica un problema, la causa del fallo es un error de configuración en uno o más componentes de la estructura de reconfiguración del gestor de volúmenes.

Solución: la solución de este problema depende de si el mensaje indica un problema:

Si el mensaje indica un problema, corríjalo del modo que se explica en Cómo recuperarse de un fallo del daemon vucmmd o de un componente relacionado.
Si el mensaje no indica ningún problema, no se requiere ninguna acción.

En línea

Descripción: la reconfiguración de Oracle RAC no se completó hasta que finalizó el tiempo de espera del método START del recurso SUNW.vucmm_framework.

Solución: si desea obtener instrucciones para corregir el problema, consulte Cómo recuperarse de la finalización del tiempo de espera del método START.

Cómo recuperarse de la finalización del tiempo de espera del método `START`

Conviértase en superusuario o asuma una función que proporcione la autorización de RBAC solaris.cluster.admin.
En el nodo en el que finalizó el tiempo de espera del método START, ponga fuera de línea el grupo de recursos de la estructura que no ha podido iniciarse.
Para llevar a cabo esta operación, cambie los nodos principales del grupo de recursos por los otros nodos en que el grupo está en línea.
```
# clresourcegroup offline -n nodelist resource-group
```
-n nodelist

Especifica una lista separada por comas de otros nodos del cluster en que resource-group está en línea. Omita de esta lista el nodo en que finalizó el tiempo de espera del método START.

resource-group

Especifica el nombre del grupo de recursos de estructura.
Si la configuración utiliza un grupo de recursos de la estructura del gestor de volúmenes de múltiples propietarios y un grupo de recursos de la estructura de Oracle RAC, ponga fuera de línea el grupo de recursos de la estructura del gestor de volúmenes de múltiples propietarios. Cuando el grupo de recursos de la estructura del gestor de volúmenes de múltiples propietarios está fuera de línea, ponga fuera de línea el grupo de recursos de la estructura de Oracle RAC.
Si el grupo de recursos Oracle RAC se creó con la utilidad clsetup, el nombre del grupo de recursos es rac-framework-rg.
En todos los nodos del cluster que pueden ejecutar Soporte para Oracle RAC, ponga en línea el grupo de recursos de la estructura que no se pudo poner en línea.
```
# clresourcegroup online resource-group
```
resource-group

Especifica que el grupo de recursos que se puso fuera de línea en el Paso 2 se va a mover al estado MANAGED y se va a poner en línea.

Fallo de un recurso al detenerse

Si un recurso no se puede detener, corrija el problema como se explica en Clearing the STOP_FAILED Error Flag on Resources de Oracle Solaris Cluster Data Services Planning and Administration Guide.

Omitir Vínculos de navegación
Salir de la Vista de impresión
	Guía de servicio de datos de Oracle para Oracle Real Application Clusters Oracle Solaris Cluster 3.3 3/13 (Español)