Solución de problemas de Oracle Exadata Database Service en sistemas de infraestructura de Exascale
En estos temas, se tratan algunos de los problemas comunes que se pueden experimentar y cómo abordarlos.
- Problemas conocidos para Exadata Database Service en infraestructura de Exascale
Problemas conocidos generales. - Solución de problemas de Oracle Data Guard
Aprenda a identificar y resolver problemas de Oracle Data Guard. - Obtención de asistencia adicional
Problemas conocidos de Exadata Database Service en la infraestructura de Exascale
Problemas conocidos generales.
Solución de problemas de Oracle Data Guard
Aprenda a identificar y resolver problemas de Oracle Data Guard.
Al solucionar problemas de Oracle Data Guard, primero debe determinar si el problema se produce durante la configuración e inicialización de Data Guard o durante la operación de Data Guard, cuando se introducen comandos de ciclo de vida. Los pasos para identificar y resolver los problemas son diferentes, dependiendo del escenario en el que se utilicen.
Hay tres operaciones de ciclo de vida: switchover, failover y reinstate. Data Guard Broker se utiliza para todos estos comandos. La interfaz de línea de comandos de broker (dgmgrl
) es la herramienta principal que se utiliza para identificar y solucionar los problemas. Aunque puede utilizar archivos log para identificar las causas raíz, dgmgrl
es más rápido y fácil de utilizar para comprobar e identificar una incidencia.
La configuración y activación de Data Guard implica varios pasos. Se crean archivos log para cada paso. Si alguno de los pasos falla, revise el archivo log correspondiente para identificar y solucionar el problema.
- Validación de la base de datos y del cluster de VM en la nube principal
- Validación del cluster de VM en la nube en espera
- Nueva creación y copia de archivos en la base de datos en espera (archivo de contraseñas y carteras)
- Creación de Data Guard a través de la red (comando RMAN Duplicate)
- Configuración de Data Guard Broker
- Finalización de la configuración
- Resolución de problemas de Data Guard mediante archivos log
Las herramientas utilizadas para identificar el problema y las ubicaciones de los archivos log relevantes son diferentes, dependiendo del escenario en el que se utilicen. - Solución de problemas del proceso de configuración de Data Guard
Revise los errores que se pueden producir en los diferentes pasos del proceso de configuración de Data Guard. Mientras que algunos errores se muestran dentro de la consola, la mayoría de las causas raíz se pueden encontrar en los archivos log
Solución de problemas de Data Guard mediante archivos log
Las herramientas utilizadas para identificar el problema y las ubicaciones de los archivos log relevantes son diferentes, dependiendo del escenario en el que se utilicen.
Utilice los siguientes procedimientos para recopilar los archivos log pertinentes para investigar las incidencias. Si no puede resolver el problema después de consultar los archivos log, póngase en contacto con My Oracle Support.
Al preparar archivos recopilados para los Servicios de Soporte Oracle, agréguelos en un archivo comprimido, como un archivo ZIP.
En cada nodo de recursos informáticos asociado a la configuración de Data Guard, recopile archivos log pertenecientes al problema que ha experimentado.
- Archivos log de etapa de activación (como los que documentan la operación de creación de base de datos en espera) y logs del sistema principal o en espera correspondiente.
- Archivos log de ID de trabajo de activación. Por ejemplo: 23.
- Ubicaciones de archivos log de activación por etapa de activación y sistema de Exadata (principal o en espera).
- Archivos log de nombres de base de datos (
db_name
odb_unique_name
, según la ruta del archivo).
Compruebe todos los nodos de los sistemas de Exadata principales y en espera correspondientes. Los comandos ejecutados en un sistema pueden haberse ejecutado en cualquiera de sus nodos.
Data Guard Deployer (DGdeployer
) es el proceso que realiza la configuración. Al configurar la base de datos principal, se crea el archivo /var/opt/oracle/log/<dbname>/dgdeployer/dgdeployer.log
.
Este log debe contener la causa raíz de un fallo al configurar la base de datos principal.
- El log principal de la utilidad de línea de comandos
dbaasapi
es:/var/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log
. Busque entradas que contengandg_api
. - Un log en espera de la utilidad de línea de comandos
dbaasapi
es:/var/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log
. En este log, busque entradas que contengandg_api
. - El otro log en espera es:
/var/opt/oracle/log/<dbname>/dgcc/dgcc.log
. Este log es el log de configuración de Data Guard.
- El motor de despliegue de Oracle Cloud (ODCE) crea el archivo
/var/opt/oracle/log/<dbname>/ocde/ocde.log
. Este log debe contener la causa de un fallo al crear la base de datos en espera. - La utilidad de línea de comandos
dbaasapi
crea el archivovar/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log
. Busque entradas que contengandg_api
. - El archivo log de configuración de Data Guard es
/var/opt/oracle/log/<dbname>/dgcc/dgcc.log
.
DGdeployer
es el proceso que realiza la configuración. Crea el siguiente archivo/var/opt/oracle/log/<dbname>/dgdeployer/dgdeployer.log
. Este log debe contener la causa raíz de un fallo al configurar la base de datos en espera.- La utilidad de línea de comandos
dbaasapi
crea el archivo/var/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log
. Busque entradas que contengandg_api
. - El log de configuración de Data Guard es
/var/opt/oracle/log/<dbname>/dgcc/dgcc.log
.
DGdeployer
es el proceso que realiza la configuración. Al configurar Data Guard, crea el archivo /var/opt/oracle/log/<dbname>/dgdeployer/dgdeployer.log
. Este log debe contener la causa raíz de un fallo al configurar la base de datos principal.
En cada nodo de los sitios principales y en espera, recopile archivos log para el nombre de base de datos relacionado (db_name
).
Compruebe todos los nodos en los sistemas Exadata principales y en espera. Una operación de gestión del ciclo de vida puede afectar tanto a sistemas principales como en espera.
- Log de alertas de base de datos:
/u02/app/oracle/diag/rdbms/<dbname>/<dbinstance>/trace/alert_<dbinstance>.log
- Log de Data Guard Broker:
/u02/app/oracle/diag/rdbms/<dbname>/<dbinstance>/trace/drc<dbinstance>.log
- Archivo log de herramientas de nube para Data Guard:
/var/opt/oracle/log/<dbname>/odg/odg.log
Tema principal: Solución de problemas de Oracle Data Guard
Solución de problemas del proceso de configuración de Data Guard
Revise los errores que se pueden producir en los diferentes pasos del proceso de configuración de Data Guard. Mientras que algunos errores se muestran dentro de la consola, la mayoría de las causas raíz se pueden encontrar en los archivos log
La contraseña introducida para activar Data Guard no coincide con la contraseña de administrador principal para el usuario SYS. Este error se produce durante la etapa de activación Validar principal.
Puede que la base de datos no esté en ejecución. Este error se produce durante la etapa de activación Validar principal. Compruebe con srvctl
y sql
en el host para verificar que la base de datos está activa y en ejecución en todos los nodos.
No se ha podido configurar la base de datos principal. Los comandos de Data Guard no válidos o la nueva configuración con fallos del listener pueden provocar este error.
No se ha podido crear la cartera de TDE. No se han podido preparar los archivos del almacén de claves (cartera) de cifrado de datos transparente (TDE) de Oracle para el transporte al sitio en espera. Este error se produce durante la etapa de activación Crear cartera de TDE. Cualquiera de los siguientes elementos puede provocar un fallo en esta etapa:
- No se ha podido acceder a los archivos de cartera de TDE
- Los comandos de activación no han podido crear un archivo que contenga los archivos de cartera
Procedimientos de solución de problemas:
- Asegúrese de que se puede acceder al cluster. Para comprobar el estado de un cluster, ejecute el siguiente comando:
crsctl check cluster -all
- Si el cluster está caído, ejecute el siguiente comando para reiniciarlo:
crsctl start crs -wait
- Si este error se produce cuando se puede acceder al cluster, consulte los logs para crear la cartera de TDE (fase de activación) para determinar la causa y la resolución del error.
Es probable que el archivo que contiene la cartera TDE no se transmitiera al sitio en espera. Volver a intentarlo suele resolver el problema.
- Es posible que los sitios principales y en espera no se puedan comunicar entre sí para configurar la base de datos en espera. Estos errores se producen durante la etapa de activación Configurar base de datos en espera. En esta etapa, las configuraciones se realizan en la base de datos en espera, incluido el comando rman duplicate de la base de datos principal. Para resolver esta incidencia:
- Verifique el estado de conectividad de los sitios principales y en espera.
- Asegúrese de que el host se puede comunicar desde el puerto 1521 con todos los puertos. Compruebe la configuración de red, incluidos los grupos de seguridad de red (NSG), las listas de seguridad de red y la configuración de intercambio de tráfico de VCN remoto (si corresponde). La mejor manera de probar la comunicación entre el host y otros nodos es acceder a las bases de datos mediante SQL*PLUS desde la principal a la en espera y desde la espera a la principal.
- Es posible que las VIP SCAN o los listeners no se estén ejecutando. Utilice la prueba anterior para ayudar a identificar el problema.
causas posibles:
- Es posible que las VIP SCAN o los listeners no se estén ejecutando. Puede confirmar esta incidencia mediante los siguientes comandos en cualquier nodo de cluster.
-
[grid@exa1-****** ~]$ srvctl status scan
-
[grid@exa1-****** ~]$ srvctl status scan_listener
-
- Tal vez no se pueda acceder a las bases de datos. Puede confirmar este problema intentando conectarse mediante un alias de Oracle Net existente.
Procedimientos de solución de problemas:
- Como usuario oracle OS, compruebe la existencia de un alias de Oracle Net para la base de datos de contenedor (CDB). Busque un alias en $ORACLE_HOME/network/admin/<dbname>/tnsnames.ora.
En el siguiente ejemplo, se muestra una entrada para una base de datos de contenedores denominada db12c:
cat $ORACLE_HOME/network/admin/db12c/tnsnames.ora DB12C = (DESCRIPTION =(ADDRESS = (PROTOCOL = TCP)(HOST = exa1-*****-scan.********.******.******.com)(PORT = 1521)) (CONNECT_DATA = (SERVER = DEDICATED) (SERVICE_NAME = db12c.********.******.******.com) (FAILOVER_MODE = (TYPE = select) (METHOD = basic))))
- Verifique que puede utilizar el alias para conectarse a la base de datos. Por ejemplo, como sysdba, introduzca el siguiente comando:
sqlplus sys@db12c
Una causa posible de este error es que las contraseñas de usuario sys o system de Oracle Database para la base de datos y la cartera de TDE no sean las mismas. Para comparar las contraseñas:
- Conéctese a la base de datos como usuario sys y compruebe el estado de TDE en
.V$ENCRYPTION_WALLET
- Conéctese a la base de datos como usuario system y compruebe el estado de TDE en
.V$ENCRYPTION_WALLET
- Actualice las contraseñas correspondientes para que coincidan. Inicie sesión en el host del sistema como opc y ejecute los siguientes comandos:
- Para cambiar la contraseña SYS:
sudo dbaascli database changepassword --dbname <database_name>
- Para cambiar la contraseña de la cartera de TDE:
sudo dbaascli tde changepassword --dbname <database_name>
- Para cambiar la contraseña SYS:
Cuando se ejecutan los comandos switchover, failover y reinstate, se pueden producir varios mensajes de error. Consulte la documentación de Oracle Database para obtener información sobre estos mensajes de error.
Nota
Oracle recomienda utilizar la interfaz de línea de comandos (dgmgrl) de Data Guard Broker para validar las configuraciones.
-
Como usuario de Oracle, conéctese a la base de datos principal o en espera con
dgmgrl
y verifique la configuración y la base de datos:dgmgrl sys/<pwd>@<database> DGMGRL> VALIDATE CONFIGURATION VERBOSE DGMGRL> VALIDATE DATABASE VERBOSE <PRIMARY> DGMGRL> VALIDATE DATABASE VERBOSE <STANDBY>
- Consulte la documentación de Oracle Database para consultar el mensaje de error respectivo. Por ejemplo:
- ORA-16766: la aplicación de redo está parada.
- ORA-16853: la demora de aplicación ha excedido el umbral especificado.
- ORA-16664: no se ha podido recibir el resultado de un miembro (para la base de datos en espera).
- ORA-12541: TNS: no hay listener (para la base de datos principal).
Tema principal: Solución de problemas de Oracle Data Guard
Obtención de asistencia adicional
Si no ha podido resolver el problema con la información de este tema, siga los procedimientos siguientes para recopilar la información de diagnóstico y de bases de datos relevante. Una vez recabada la información, póngase en contacto con los Servicios de Soporte Oracle.
- Recopilación de logs de herramientas en la nube
Utilice los archivos log relevantes que podrían ayudar a los Servicios de Soporte Oracle en una investigación más a fondo y la resolución de un problema determinado. - Recopilación de Oracle Diagnostics
Temas relacionados
Recopilación de logs de herramientas en la nube
Utilice los archivos log relevantes que podrían ayudar a los Servicios de Soporte Oracle en una investigación más a fondo y la resolución de un problema determinado.
Logs de DBAASCLI
/var/opt/oracle/log/dbaascli
dbaascli.log
Tema principal: Obtención de asistencia adicional
Recopilación de Oracle Diagnostics
Para recopilar los logs y la información de diagnóstico relevantes de Oracle, ejecute el comando dbaascli diag collect
.
Para obtener más información sobre el uso de esta utilidad, consulte Herramientas DBAAS: uso de dbaascli para recopilar registros de herramientas de nube y realizar una comprobación del sistema de las herramientas de nube.