Solución de problemas de sistemas Exadata Cloud Infrastructure

En estos temas, se tratan algunos de los problemas comunes que se pueden experimentar y cómo abordarlos.

Incidencias conocidas de Exadata Cloud Infrastructure

Incidencias conocidas generales.

Fallo de escalado fuera de línea de la CPU

Descripción: el escalado fuera de línea de la CPU falla con el siguiente error:
** CPU Scale Update **An error occurred during module execution. Please refer to the log file for more information

Causa: después de aprovisionar un cluster de VM, el archivo /var/opt/oracle/cprops/cprops.ini, generado automáticamente por la base de datos como servicio (DBaaS), no se actualiza con los parámetros common_dcs_agent_bindHost y common_dcs_agent_port y esto hace que falle el escalado fuera de línea de la CPU.

Acción: como usuario root, agregue manualmente las siguientes entradas en el archivo /var/opt/oracle/cprops/cprops.ini.
common_dcs_agent_bindHost=<IP_Address>
common_dcs_agent_port=7070
Nota

El valor common_dcs_agent_port es siempre 7070.
Ejecute el siguiente comando para obtener la dirección IP:
netstat -tunlp | grep 7070
Por ejemplo:
netstat -tunlp | grep 7070
tcp 0 0 <IP address 1>:7070 0.0.0.0:* LISTEN 42092/java
tcp 0 0 <IP address 2>:7070 0.0.0.0:* LISTEN 42092/java

Puede especificar una cualquiera de las dos direcciones IP, <IP address 1> o <IP address 2>, para el parámetro common_dcs_agent_bindHost.

Fallo al agregar una VM a un cluster de VM

Descripción: al agregar una VM a un cluster de VM, es posible que encuentre la siguiente incidencia:
[FATAL] [INS-32156] Installer has detected that there are non-readable files in oracle home.
CAUSE: Following files are non-readable, due to insufficient permission oracle.ahf/data/scaqak03dv0104/diag/tfa/tfactl/user_root/tfa_client.trc
ACTION: Ensure the above files are readable by grid.

Causa: el instalador ha detectado un archivo de rastreo no legible, oracle.ahf/data/scaqak03dv0104/diag/tfa/tfactl/user_root/tfa_client.trc, creado por Autonomous Health Framework (AHF) en el directorio raíz de Oracle que provoca un fallo al agregar una VM de cluster.

AHF ejecutado como root ha creado un archivo trc con propiedad root que el usuario grid no puede leer.

Acción: asegúrese de que los archivos de rastreo de AHF son legibles para el usuario grid antes de agregar las VM a un cluster de VM. Para solucionar la incidencia de permiso, ejecute los siguientes comandos como root en todas las VM de cluster de VM existentes:
chown grid:oinstall /u01/app/19.0.0.0/grid/srvm/admin/logging.properties
chown -R grid:oinstall /u01/app/19.0.0.0/grid/oracle.ahf*
chown -R grid:oinstall /u01/app/grid/oracle.ahf*

Solución de problemas de conectividad de red

Para determinar si un cluster de VM está configurado correctamente para acceder a la red de servicios de Oracle Cloud Infrastructure (OCI), debe realizar los siguientes pasos en cada máquina virtual del cluster de VM.

Comprobación de validación de la conectividad de gestión de identidades y accesos:

  • Aplique ssh a una máquina virtual del cluster de VM ExaDB-D como usuario opc.
  • Ejecute el comando: curl https://identity.<region>.oci.oraclecloud.com, donde <region> se corresponde con la región de OCI donde se despliega el cluster de VM. Si el cluster de VM se despliega en la región de Ashburn, debe utilizar "us-ashburn-1" para <region>. El comando curl ahora tendrá el aspecto curl https://identity.us-ashburn-1.oci.oraclecloud.com.
  • Si la red virtual en la nube (VCN) está configurada correctamente para acceder a la red de servicios de OCI, obtendrá una respuesta inmediata similar a la que se muestra
    {
     "code" : "NotAuthorizedOrNotFound",
     "message" : "Authorization failed or requested resource not found."
    } 
  • La sesión ssh se bloqueará y se producirá un timeout si la red no está configurada para acceder a los servicios de OCI
  • En función de la configuración de la VCN, deberá seguir los pasos descritos en la sección de acción siguiente para configurar el acceso a la red de servicios de OCI.

Comprobación de validación de la conectividad del servicio Object Storage (OSS):

  • Aplique ssh a una máquina virtual del cluster de VM ExaDB-D como usuario opc.
  • Ejecute el comando: curl https://objectstorage.<region>.oraclecloud.com, donde <region> corresponde a la región de OCI donde se despliega el cluster de VM. Si el cluster de VM se despliega en la región de Ashburn, debe utilizar "us-ashburn-1" para <region>. El comando curl ahora se parecerá a curl https://objectstorage.us-ashburn-1.oraclecloud.com.
  • Si la red virtual en la nube (VCN) está configurada correctamente para acceder a la red de servicios de OCI, obtendrá una respuesta inmediata similar a la que se muestra
    {
     "code" : "NotAuthorizedOrNotFound",
     "message" : "Authorization failed or requested resource not found."
    }
  • La sesión ssh se bloqueará y se producirá un timeout si la red no está configurada para acceder a los servicios de OCI
  • En función de la configuración de la VCN, deberá seguir los pasos descritos en la sección de acción siguiente para configurar el acceso a la red de servicios de OCI.

Acción:

Una vez que configure la VCN para acceder a la red de servicios de OCI siguiendo las instrucciones anteriores, ejecute los pasos de ambas secciones Comprobación de validación para asegurarse de que ha establecido la conectividad a la red de servicios de OCI desde el cluster de VM.

Información adicional:

Puede encontrar instrucciones para actualizar un gateway de servicio aquí (https://docs.oracle.com/en-us/iaas/Content/Network/Tasks/servicegateway.htm#switch_label)

Fallos de copia de seguridad en Exadata Database Service on Dedicated Infrastructure

Si la copia de seguridad gestionada por Exadata no se completa correctamente, puede utilizar los procedimientos de este tema para solucionar los problemas.

Las causas más comunes de fallos de copias de seguridad son las siguientes:

  • El host no puede acceder a Object Storage
  • La configuración de la base de datos en el host no es correcta

La información siguiente está organizada por las distintas condiciones de error. Si ya sabe la causa, puede ir a la sección con la solución sugerida. De lo contrario, utilice el procedimiento descrito en Determinación del problema para comenzar.

Determinación del problema

En la consola, una copia de seguridad de base de datos con fallos muestra el estado Con fallos o se bloquea en el estado Copia de seguridad en curso o Creando.

Si el mensaje de error no contiene suficiente información para darle una solución, puede recopilar más información utilizando dbaascli y consultando los archivos log. A continuación, consulte la sección correspondiente de este tema para encontrar una solución.

Las copias de seguridad de la base de datos pueden fallar durante la etapa de configuración de RMAN o durante un trabajo de copia de seguridad deRMAN en ejecución. Las tareas de configuración de RMAN incluyen la validación de la conectividad del destino de copia de seguridad, la instalación del módulo de copia de seguridad y los cambios de configuración de RMAN. Los archivos log que examine dependen de la etapa en la que se produzca el fallo.

  1. Inicie sesión en el host como usuario oracle.
  2. Consulte el archivo log aplicable:
    • Para identificar el ID de trabajo de una copia de seguridad automatizada, utilice el comando dbaascli database backup --dbname <dbname> --showHistory. Muestra el historial de todos los trabajos de copia de seguridad, incluidos sus correspondientes ID de trabajo.
    • Los logs de trabajos están disponibles en /var/opt/oracle/log/dtrs/jobs/, denominado con el formato <job_id>.log. Si un trabajo falla, también se genera un log de depuración correspondiente <job_id>.debug en la misma ubicación.
    • Puede encontrar los logs de ejecución del comando RMAN correspondientes para las operaciones de copia de seguridad, recuperación y configuración en el directorio /var/opt/oracle/log/<dbname>/dtrs/rman/bkup.
Nota

Asegúrese de revisar los archivos log en todos los nodos de cálculo del sistema de base de datos de Exadata.

Incidencias del agente de Database Service

Su base de datos Oracle Cloud Infrastructure utiliza un marco de agente para que pueda gestionar su base de datos a través de la plataforma en la nube. Utilice lo siguiente para comprobar y reiniciar dbcsagent.

En ocasiones, puede que necesite reiniciar el programa dbcsagent si tiene el estado parada/en espera para resolver un fallo de copia de seguridad. Consulte el archivo /opt/oracle/dcs/log/dcs-agent.log para identificar las incidencias relacionadas con el agente.

  1. Desde un símbolo del sistema, compruebe el estado del agente:
    systemctl status dbcsagent.service
  2. Si el agente tiene el estado parada/en espera, intente reiniciar el agente:
    systemctl start dbcsagent.service
  3. Vuelva a comprobar el estado del agente para confirmar que tiene el estado parada/en ejecución:
    systemctl status dbcsagent.service

Incidencias de conectividad del almacén de objetos

Para realizar una copia de seguridad de la base de datos en Oracle Cloud Infrastructure Object Storage, es necesario que el host se pueda conectar al punto final de Swift aplicable.

Aunque Oracle controla las credenciales de usuario de Swift reales para el cubo de almacenamiento para copias de seguridad gestionadas, verificar la conectividad general a Object Storage en su región es un buen indicador de que la conectividad del almacén de objetos no es la raíz del problema. Puede probar esta conectividad con otro usuario de Swift.

  1. Cree un usuario de Swift en su arrendamiento. Consulte Trabajar con token de autenticación.
  2. Con el usuario que ha creado en el paso anterior, utilice el siguiente comando para verificar que el host puede acceder al almacén de objetos.
    curl -v -X HEAD -u <user_ID>:'<auth_token>' https://swiftobjectstorage.<region_name>.oraclecloud.com/v1/<object_storage_namespace>
    Consulte Preguntas frecuentes sobre Object Storage para conocer la región correcta que se debe utilizar. Consulte Descripción de los espacios de nombres de Object Storage para obtener información sobre el espacio de nombres de Object Storage.
  3. Si no se puede conectar al almacén de objetos, consulte el tema Requisitos para copias de seguridad en Exadata Cloud Service para obtener información sobre la configuración de la conectividad del almacén de objetos.

Incidencias del host

Una o varias de las siguientes condiciones en el host de la base de datos pueden provocar fallos en las copias de seguridad.

Si un comando interactivo como oraenv, o cualquier comando que pueda devolver un mensaje de error o advertencia, se ha agregado al archivo .bash_profile para el usuario grid u oracle, las operaciones del servicio Database como las copias de seguridad automáticas se pueden interrumpir sin haber finalizado. Consulte el archivo .bash_profile para estos comandos y elimínelos.

Las operaciones de copia de seguridad requieren espacio en el directorio /u01 del sistema de archivos del host. Utilice el comando df -h en el host para comprobar el espacio disponible para las copias de seguridad. Si el sistema de archivos no tiene espacio suficiente, puede eliminar archivos de rastreo o archivos log antiguos para liberar espacio.

Puede que el sistema no tenga la versión necesaria del módulo de copia de seguridad (opc_installer.jar). Consulte No se han podido utilizar las copias de seguridad gestionadas en el sistema de base de datos para obtener más información sobre este problema conocido. Para corregir el problema, puede seguir el procedimiento de esa sección o simplemente actualizar el sistema de base de datos y la base de datos con el último paquete de parches.

La personalización del archivo de perfil de ubicación ($ORACLE_HOME/sqlplus/admin/glogin.sql) puede hacer que las copias de seguridad gestionadas fallen en Oracle Cloud Infrastructure. En concreto, los comandos interactivos pueden producir fallos en las copias de seguridad. Oracle recomienda no modificar este archivo para bases de datos alojadas en Oracle Cloud Infrastructure.

Incidencias de la base de datos

Una configuración o estado de la base de datos incorrectos pueden provocar fallos en las copias de seguridad.

La base de datos debe estar activa y en ejecución (lo ideal es en todos los nodos) mientras la copia de seguridad está en curso.

Utilice el siguiente comando para comprobar el estado de la base de datos y asegúrese de que se resuelven los problemas que pueden haber ocasionado que la base de datos esté en un estado incorrecto:
srvctl status database -d <db_unique_name> -verbose
El sistema devuelve un mensaje que incluye el estado de la instancia de base de datos. El estado de la instancia debe ser Open para que la copia de seguridad se realice correctamente. Si la base de datos no se está ejecutando, utilice el comando siguiente para iniciarla:
srvctl start database -d <db_unique_name> -o open
Si la base de datos está montada, pero no tiene el estado Open, utilice los siguientes comandos para acceder al símbolo del sistema de SQL*Plus y definir el estado en Open:
sqlplus / as sysdba
alter database open;

Al aprovisionar una nueva base de datos, el modo de archivado se define en ARCHIVELOG por defecto. Este es el modo de archivado necesario para las operaciones de copia de seguridad. Si corresponde, compruebe el ajuste de modo de archivado de la base de datos y cámbielo a ARCHIVELOG.

Abra un símbolo del sistema de SQL*Plus e introduzca lo siguiente:
select log_mode from v$database;
Si necesita definir el modo de archivado en ARCHIVELOG, inicie la base de datos en estado MOUNT (y no en estado OPEN) y utilice el siguiente comando en el símbolo del sistema de SQL*Plus:
alter database archivelog;

Confirme que el parámetro db_recovery_file_dest apunta a +RECO y que el parámetro log_archive_dest_1 está ajustado en USE_DB_RECOVERY_FILE_DEST.

Para bases de datos RAC, una instancia debe tener el estado MOUNT al activar el modo archivelog. Para activar el modo archivelog para una base de datos RAC, realice los siguientes pasos:

  1. Cierre todas las instancias de base de datos:
    srvctl stop database -d
  2. Inicie una de las instancias de base de datos en estado MOUNT:
    srvctl start instance -d <db_unique_name> -i <instance_name> -o mount
  3. Acceda al símbolo del sistema de SQL*Plus:
    sqlplus / as sysdba
  4. Active el modo de archive log:
    alter database archivelog; 
    exit;
  5. Pare la base de datos:
    srvctl stop instance -d <db_unique_name> -i <instance_name>
  6. Reinicie todas las instancias de base de datos:
    srvctl start database -d <db_unqiue_name>
  7. En el símbolo del sistema de SQL*Plus, confirme que el modo de archivado está configurado en: ARCHIVELOG:
    select log_mode from v$database;
Las copias de seguridad pueden fallar cuando la instancia de base de datos tenga un proceso de archivador parado. Por ejemplo, esto puede ocurrir cuando el área de recuperación de flash (FRA) está llena. Puede comprobar esta condición con el comando srvctl status database -db <db_unique_name> -v. Si el comando devuelve la siguiente salida, debe resolver la incidencia del proceso de archivador parado para que las copias de seguridad se realicen correctamente:
Instance <instance_identifier> is running on node *<node_identifier>. Instance status: Stuck Archiver

Consulte ORA-00257: error de archivador (ID de documento 2014425.1) para obtener información sobre la resolución de un proceso de archivador parado.

Después de resolver el proceso parado, el comando debe devolver la siguiente salida:
Instance <instance_identifier> is running on node *<node_identifier>. Instance status: Open

Si el estado de la instancia no cambia después de resolver la incidencia subyacente con el dispositivo o recurso lleno o no disponible, intente reiniciar la base de datos mediante el comando srvctl para actualizar el estado de la base de datos en el clusterware.

La edición de algunos parámetros de configuración de RMAN puede producir fallos de copia de seguridad en Oracle Cloud Infrastructure. Para comprobar la configuración de RMAN, utilice el comando show all en el símbolo del sistema de la línea de comandos de RMAN.

Consulte la siguiente lista de parámetros para obtener más información sobre los valores de configuración de RMAN que no se deben modificar para las bases de datos en Oracle Cloud Infrastructure.


CONFIGURE RETENTION POLICY TO RECOVERY WINDOW OF 30 DAYS;

CONFIGURE CONTROLFILE AUTOBACKUP ON;

CONFIGURE DEVICE TYPE 'SBT_TAPE' PARALLELISM 5 BACKUP TYPE TO COMPRESSED BACKUPSET;

CONFIGURE CHANNEL DEVICE TYPE DISK MAXPIECESIZE 2 G;

CONFIGURE CHANNEL DEVICE TYPE 'SBT_TAPE' PARMS  'SBT_LIBRARY=/var/opt/oracle/dbaas_acfs/<db_name>/opc/libopc.so, ENV=(OPC_PFILE=/var/opt/oracle/dbaas_acfs/<db_name>/opc/opc<db_name>.ora)';

CONFIGURE ARCHIVELOG DELETION POLICY TO BACKED UP 1 TIMES TO 'SBT_TAPE';

CONFIGURE CHANNEL DEVICE TYPE DISK MAXPIECESIZE 2 G;

CONFIGURE ENCRYPTION FOR DATABASE ON;

Las copias de seguridad de RMAN fallan cuando se pierde un archivo de cartera del almacén de objetos. El archivo de cartera es necesario para activar la conectividad al almacén de objetos.

  1. Obtenga el nombre de la base de datos con el fallo de copia de seguridad mediante SQL*Plus:
    show parameter db_name
  2. Determine la ruta de acceso del archivo de parámetros de configuración de copia de seguridad que contiene la información de la cartera de RMAN en la línea de comandos de Linux:

    locate opc_<database_name>.ora
    Por ejemplo:
    
    find / -name "opctestdb30.ora" -print /var/opt/oracle/dbaas_acfs/testdb30/opc/opctestdb30.ora
  3. Busque la ruta de archivo en el archivo de cartera en el archivo de parámetros de configuración de copia de seguridad inspeccionando el valor almacenado en el parámetro OPC_WALLET. Para ello, vaya al directorio que contiene el archivo de parámetros de configuración de copia de seguridad y utilice el siguiente comando cat:
    cat opc<database_name>.ora
    Por ejemplo:
    
    cd /var/opt/oracle/dbaas_acfs/testdb30/opc/
    ls -altr *.ora
    opctestdb30.ora
    cat opctestdb30.ora
    OPC_HOST=https://swiftobjectstorage.us-phoenix-1.oraclecloud.com/v1/dbbackupphx
    OPC_WALLET='LOCATION=file:/var/opt/oracle/dbaas_acfs/testdb30/opc/opc_wallet CREDENTIAL_ALIAS=alias_opc'
    OPC_CONTAINER=bUG3TFsSi8QzjWfuTxqqExample
    _OPC_DEFERRED_DELETE=false
  4. Confirme que el archivo cwallet.sso existe en el directorio especificado en el parámetro OPC_WALLET y confirme que el archivo tiene los permisos correctos. Los permisos de archivo deben tener el valor octal "600" (-rw-------). Utilice el comando siguiente:

    ls -ltr /var/opt/oracle/dbaas_acfs/<database_name>/opc/opc_wallet
    Por ejemplo:
    
    ls -altr /var/opt/oracle/dbaas_acfs/testdb30/opc/opc_wallet
    -rw------- 1 oracle oinstall 0 Oct 29 01:59 cwallet.sso.lck
    -rw------- 1 oracle oinstall 111231 Oct 29 01:59 cwallet.sso
    

Cartera TDE y fallos de copia de seguridad

Aprenda a identificar la causa raíz de los fallos de copia de seguridad y cartera de TDE.

Para que las operaciones de copia de seguridad funcionen, el archivo $ORACLE_HOME/network/admin/sqlnet.ora debe contener el parámetro ENCRYPTION_WALLET_LOCATION con el siguiente formato:
ENCRYPTION_WALLET_LOCATION=(SOURCE=(METHOD=FILE)(METHOD_DATA=(DIRECTORY=/var/opt/oracle/dbaas_acfs/<database_name>/tde_wallet)))
Utilice el comando cat para comprobar la especificación de ubicación de cartera de TDE. Por ejemplo:
$ cat $ORACLE_HOME/network/admin/sqlnet.ora 
ENCRYPTION_WALLET_LOCATION=(SOURCE=(METHOD=FILE)(METHOD_DATA=(DIRECTORY=/var/opt/oracle/dbaas_acfs/<database_name>/tde_wallet)))

Las copias de seguridad de la base de datos fallan si la cartera de TDE no tiene el estado adecuado. Los siguientes escenarios pueden provocar este problema:

Si la base de datos se ha iniciado mediante SQL*Plus y no se ha definido la variable de entorno ORACLE_UNQNAME, la cartera no se abre correctamente.

Para solucionar el problema, inicie la base de datos con la utilidad srvctl:
srvctl start database -d <db_unique_name>

En un entorno multiinquilino para versiones de Oracle Database que soporten el almacén de claves de nivel PDB, cada PDB tiene su propia clave de cifrado maestra. Para bases de datos de Oracle 18c, esta clave de cifrado se almacena en un único almacén de claves utilizado por todos los contenedores. (Oracle Database 19c no soporta un almacén de claves en el nivel de la PDB.) Después de crear o conectar una nueva PDB, debe crear y activar una clave de cifrado maestra para ella. Si no lo hace, la columna STATUS de la vista v$encryption_wallet mostrará el valor OPEN_NO_MASTER_KEY.

Para comprobar el estado de la clave de cifrado maestra y crear una clave maestra, realice lo siguiente:

  1. Revise la columna STATUS en la vista v$encryption_wallet, como se muestra en el siguiente ejemplo:
    
    SQL> alter session set container=pdb2;
    Session altered.
    
    SQL> select WRL_TYPE,WRL_PARAMETER,STATUS,WALLET_TYPE from v$encryption_wallet;
    
    WRL_TYPE   WRL_PARAMETER                                   STATUS             WALLET_TYPE
    ---------- ----------------------------------------------- ------------------ -----------
    FILE       /var/opt/oracle/dbaas_acfs/testdb30/tde_wallet/ OPEN_NO_MASTER_KEY AUTOLOGIN
  2. Confirme que la PDB está en modo READ WRITE y que no está restringida, como se muestra en el siguiente ejemplo:
    
    SQL> show pdbs
    
    CON_ID CON_NAME     OPEN MODE              RESTRICTED
    ------ ------------ ---------------------- ---------------
    2      PDB$SEED     READ ONLY              NO
    3      PDB1         READ WRITE             NO
    4      PDB2         READ WRITE             NO

    La PDB no puede estar abierta en modo restringido (la columna RESTRICTED debe mostrar NO). Si la PDB está en modo restringido actualmente, revise la información en la vista PDB_PLUG_IN_VIOLATIONS y resuelva la incidencia antes de continuar. Para obtener más información sobre la vista PDB_PLUG_IN_VIOLATIONS y el estado restringido, consulte la Oracle Multitenant Administrator’s Guide sobre la base de datos conectable para su versión de base de datos Oracle.

  3. Cree y active una clave de cifrado maestra para la PDB:

    • Defina el contenedor en la PDB:
      ALTER SESSION SET CONTAINER = <pdb>;
    • Para crear y activar una clave de cifrado maestra en la PDB, ejecute el siguiente comando:
      ADMINISTER KEY MANAGEMENT SET KEY USING TAG '<tag>' 
      FORCE KEYSTORE IDENTIFIED BY <keystore-password> WITH BACKUP USING '<backup_identifier>';

    Tenga en cuenta lo siguiente:

    • La cláusula opcional USING TAG se puede utilizar para asociar una etiqueta a la nueva clave de cifrado maestra.
    • La cláusula WITH BACKUP es opcional y se puede utilizar para crear una copia de seguridad del almacén de claves antes de crear la nueva clave de cifrado maestra.

    También puede utilizar los comandos dbaascli, dbaascli tde status y dbaascli tde rotate masterkey para investigar y gestionar las claves.

  4. Confirme que el estado de la cartera ha cambiado de OPEN_NO_MASTER_KEY a OPEN consultando la vista v$encryption_wallet como se muestra en el paso 1.

Los parámetros de configuración relacionados con la cartera de TDE pueden provocar fallos en las copias de seguridad.

Confirme que el estado de la cartera es open y que el tipo de cartera es auto login consultando la vista v$encryption_wallet. Por ejemplo:

SQL> select status, wrl_parameter,wallet_type from v$encryption_wallet;

STATUS  WRL_PARAMETER                                  WALLET_TYPE
------- ---------------------------------------------- --------------
OPEN   /var/opt/oracle/dbaas_acfs/testdb30/tde_wallet/ AUTOLOGIN
Para bases de datos conectables (PDB), asegúrese de cambiar al contenedor adecuado antes de consultar la vista v$encryption_wallet. Por ejemplo:

$ sqlplus / as sysdba

SQL> alter session set container=pdb1;

Session altered.

SQL> select WRL_TYPE,WRL_PARAMETER,STATUS,WALLET_TYPE from v$encryption_wallet;

WRL_TYPE  WRL_PARAMETER                                   STATUS   WALLET_TYPE
--------- ----------------------------------------------- -------- -----------
FILE      /var/opt/oracle/dbaas_acfs/testdb30/tde_wallet/ OPEN     AUTOLOGIN
El archivo de cartera de TDE (ewallet.p12) puede hacer que las copias de seguridad fallen si falta, o si los permisos o la propiedad del sistema de archivos no son compatibles. Compruebe el archivo como se muestra en el siguiente ejemplo como usuario root:
# ls -altr /var/opt/oracle/dbaas_acfs/<database_name>/tde_wallet/ewallet.p12
total 76
-rw------ 1 oracle oinstall 5467 Oct 1 20:17 ewallet.p12

El archivo de cartera de TDE debe tener permisos de archivo con el valor octal "600" (-rw-------) y el propietario de este archivo debe formar parte del grupo del sistema operativo oinstall.

El archivo de cartera de inicio de sesión automático (cwallet.sso) puede hacer que las copias de seguridad fallen si falta, o si los permisos o la propiedad del sistema de archivos no son compatibles. Compruebe el archivo como se muestra en el siguiente ejemplo como usuario root:

# ls -altr /var/opt/oracle/dbaas_acfs/<database_name>/tde_wallet/cwallet.sso
total 76
-rw------ 1 oracle oinstall 5512 Oct 1 20:18 cwallet.sso

El archivo de cartera de conexión automática debe tener permisos de archivo con el valor octal "600" (-rw-------), y el propietario de este archivo debe formar parte del grupo del sistema operativo oinstall.

Solución de problemas de Oracle Data Guard

Aprenda a identificar y resolver problemas de Oracle Data Guard.

Al solucionar problemas de Oracle Data Guard, primero debe determinar si el problema se produce durante la configuración e inicialización de Data Guard o durante la operación de Data Guard, cuando se introducen comandos de ciclo de vida. Los pasos para identificar y resolver los problemas son diferentes, dependiendo del escenario en el que se utilicen.

Hay tres operaciones de ciclo de vida: switchover, failover y reinstate. Data Guard Broker se utiliza para todos estos comandos. La interfaz de línea de comandos de broker (dgmgrl) es la herramienta principal que se utiliza para identificar y solucionar los problemas. Aunque puede utilizar archivos log para identificar las causas raíz, dgmgrl es más rápido y fácil de utilizar para comprobar e identificar una incidencia.

La configuración y activación de Data Guard implica varios pasos. Se crean archivos log para cada paso. Si alguno de los pasos falla, revise el archivo log correspondiente para identificar y solucionar el problema.

  • Validación de la base de datos y del cluster de VM en la nube principal
  • Validación del cluster de VM en la nube en espera
  • Nueva creación y copia de archivos en la base de datos en espera (archivo de contraseñas y carteras)
  • Creación de Data Guard a través de la red (comando RMAN Duplicate)
  • Configuración de Data Guard Broker
  • Finalización de la configuración

Solución de problemas de Data Guard mediante archivos log

Las herramientas utilizadas para identificar el problema y las ubicaciones de los archivos log relevantes son diferentes, dependiendo del escenario en el que se utilicen.

Utilice los siguientes procedimientos para recopilar los archivos log pertinentes para investigar las incidencias. Si no puede resolver el problema después de consultar los archivos log, póngase en contacto con My Oracle Support.

Nota

Al preparar archivos recopilados para los Servicios de Soporte Oracle, agréguelos en un archivo comprimido, como un archivo ZIP.

En cada nodo de recursos informáticos asociado a la configuración de Data Guard, recopile archivos log pertenecientes al problema que ha experimentado.

  • Archivos log de etapa de activación (como los que documentan la operación de creación de base de datos en espera) y logs del sistema principal o en espera correspondiente.
  • Archivos log de ID de trabajo de activación. Por ejemplo: 23.
  • Ubicaciones de archivos log de activación por etapa de activación y sistema de Exadata (principal o en espera).
  • Archivos log de nombres de base de datos (db_name o db_unique_name, según la ruta del archivo).
Nota

Compruebe todos los nodos de los sistemas de Exadata principales y en espera correspondientes. Los comandos ejecutados en un sistema pueden haberse ejecutado en cualquiera de sus nodos.

Data Guard Deployer (DGdeployer) es el proceso que realiza la configuración. Al configurar la base de datos principal, se crea el archivo /var/opt/oracle/log/<dbname>/dgdeployer/dgdeployer.log.

Este log debe contener la causa raíz de un fallo al configurar la base de datos principal.

  • El log principal de la utilidad de línea de comandos dbaasapi es: /var/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log. Busque entradas que contengan dg_api.
  • Un log en espera de la utilidad de línea de comandos dbaasapi es: /var/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log. En este log, busque entradas que contengan dg_api.
  • El otro log en espera es: /var/opt/oracle/log/<dbname>/dgcc/dgcc.log. Este log es el log de configuración de Data Guard.
  • El motor de despliegue de Oracle Cloud (ODCE) crea el archivo /var/opt/oracle/log/<dbname>/ocde/ocde.log. Este log debe contener la causa de un fallo al crear la base de datos en espera.
  • La utilidad de línea de comandos dbaasapi crea el archivo var/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log. Busque entradas que contengan dg_api.
  • El archivo log de configuración de Data Guard es /var/opt/oracle/log/<dbname>/dgcc/dgcc.log.
  • DGdeployer es el proceso que realiza la configuración. Crea el siguiente archivo /var/opt/oracle/log/<dbname>/dgdeployer/dgdeployer.log. Este log debe contener la causa raíz de un fallo al configurar la base de datos en espera.
  • La utilidad de línea de comandos dbaasapi crea el archivo /var/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log. Busque entradas que contengan dg_api.
  • El log de configuración de Data Guard es /var/opt/oracle/log/<dbname>/dgcc/dgcc.log.

DGdeployer es el proceso que realiza la configuración. Al configurar Data Guard, crea el archivo /var/opt/oracle/log/<dbname>/dgdeployer/dgdeployer.log. Este log debe contener la causa raíz de un fallo al configurar la base de datos principal.

En cada nodo de los sitios principales y en espera, recopile archivos log para el nombre de base de datos relacionado (db_name).

Nota

Compruebe todos los nodos en los sistemas Exadata principales y en espera. Una operación de gestión del ciclo de vida puede afectar tanto a sistemas principales como en espera.
  • Log de alertas de base de datos: /u02/app/oracle/diag/rdbms/<dbname>/<dbinstance>/trace/alert_<dbinstance>.log
  • Log de Data Guard Broker: /u02/app/oracle/diag/rdbms/<dbname>/<dbinstance>/trace/drc<dbinstance>.log
  • Archivo log de herramientas de nube para Data Guard: /var/opt/oracle/log/<dbname>/odg/odg.log

Solución de problemas del proceso de configuración de Data Guard

Se pueden producir los siguientes errores en los diferentes pasos del proceso de configuración de Data Guard. Mientras que algunos errores se muestran dentro de la consola, la mayoría de las causas raíz se pueden encontrar en los archivos log

La contraseña introducida para activar Data Guard no coincide con la contraseña de administrador principal para el usuario SYS. Este error se produce durante la etapa de activación Validar principal.

Puede que la base de datos no esté en ejecución. Este error se produce durante la etapa de activación Validar principal. Compruebe con srvctl y sql en el host para verificar que la base de datos está activa y en ejecución en todos los nodos.

No se ha podido configurar la base de datos principal. Los comandos de Data Guard no válidos o la nueva configuración con fallos del listener pueden provocar este error.

No se ha podido crear la cartera de TDE. No se han podido preparar los archivos del almacén de claves (cartera) de cifrado de datos transparente (TDE) de Oracle para el transporte al sitio en espera. Este error se produce durante la etapa de activación Crear cartera de TDE. Cualquiera de los siguientes elementos puede provocar un fallo en esta etapa:

  • No se ha podido acceder a los archivos de cartera de TDE
  • Los comandos de activación no han podido crear un archivo que contenga los archivos de cartera

Procedimientos de solución de problemas:

  1. Asegúrese de que se puede acceder al cluster. Para comprobar el estado de un cluster, ejecute el siguiente comando:
    crsctl check cluster -all
  2. Si el cluster está caído, ejecute el siguiente comando para reiniciarlo:
    crsctl start crs -wait
  3. Si este error se produce cuando se puede acceder al cluster, consulte los logs para crear la cartera de TDE (fase de activación) para determinar la causa y la resolución del error.

Es probable que el archivo que contiene la cartera TDE no se transmitiera al sitio en espera. Volver a intentarlo suele resolver el problema.

  • Es posible que los sitios principales y en espera no se puedan comunicar entre sí para configurar la base de datos en espera. Estos errores se producen durante la etapa de activación Configurar base de datos en espera. En esta etapa, las configuraciones se realizan en la base de datos en espera, incluido el comando rman duplicate de la base de datos principal. Para resolver esta incidencia:
    1. Verifique el estado de conectividad de los sitios principales y en espera.
    2. Asegúrese de que el host se puede comunicar desde el puerto 1521 con todos los puertos. Compruebe la configuración de red, incluidos los grupos de seguridad de red (NSG), las listas de seguridad de red y la configuración de intercambio de tráfico de VCN remoto (si corresponde). La mejor manera de probar la comunicación entre el host y otros nodos es acceder a las bases de datos mediante SQL*PLUS desde la principal a la en espera y desde la espera a la principal.
  • Es posible que las VIP SCAN o los listeners no se estén ejecutando. Utilice la prueba anterior para ayudar a identificar el problema.

Causas posibles:

  • Es posible que las VIP SCAN o los listeners no se estén ejecutando. Puede confirmar esta incidencia mediante los siguientes comandos en cualquier nodo de cluster.
    • [grid@exa1-****** ~]$ srvctl status
                  scan
    • [grid@exa1-****** ~]$ srvctl status
                    scan_listener
  • Tal vez no se pueda acceder a las bases de datos. Puede confirmar este problema intentando conectarse mediante un alias de Oracle Net existente.

Procedimientos de solución de problemas:

  1. Como usuario oracle OS, compruebe la existencia de un alias de Oracle Net para la base de datos de contenedor (CDB). Busque un alias en $ORACLE_HOME/network/admin/<dbname>/tnsnames.ora.

    En el siguiente ejemplo, se muestra una entrada para una base de datos de contenedores denominada db12c:

    cat $ORACLE_HOME/network/admin/db12c/tnsnames.ora 
    DB12C = (DESCRIPTION =(ADDRESS = (PROTOCOL = TCP)(HOST = exa1-*****-scan.********.******.******.com)(PORT = 1521)) 
    (CONNECT_DATA = (SERVER = DEDICATED) (SERVICE_NAME = db12c.********.******.******.com) 
    (FAILOVER_MODE = (TYPE = select) (METHOD = basic))))
  2. Verifique que puede utilizar el alias para conectarse a la base de datos. Por ejemplo, como sysdba, introduzca el siguiente comando:
    sqlplus sys@db12c

Una causa posible de este error es que las contraseñas de usuario sys o system de Oracle Database para la base de datos y la cartera de TDE no sean las mismas. Para comparar las contraseñas:

  1. Conéctese a la base de datos como usuario sys y compruebe el estado de TDE en
    V$ENCRYPTION_WALLET
    .
  2. Conéctese a la base de datos como usuario system y compruebe el estado de TDE en
    V$ENCRYPTION_WALLET
    .
  3. Actualice las contraseñas correspondientes para que coincidan. Inicie sesión en el host del sistema como opc y ejecute los siguientes comandos:
    1. Para cambiar la contraseña SYS:
      sudo dbaascli database changepassword --dbname <database_name>
    2. Para cambiar la contraseña de la cartera de TDE:
      sudo dbaascli tde changepassword --dbname <database_name>

Para conocer las posibles causas y resoluciones de las incidencias de la cartera de TDE, consulte Cartera de TDE y fallos de copia de seguridad.

Cuando se ejecutan los comandos switchover, failover y reinstate, se pueden producir varios mensajes de error. Consulte la documentación de Oracle Database para obtener información sobre estos mensajes de error.

Nota

Oracle recomienda utilizar la interfaz de línea de comandos (dgmgrl) de Data Guard Broker para validar las configuraciones.

  1. Como usuario de Oracle, conéctese a la base de datos principal o en espera con dgmgrl y verifique la configuración y la base de datos:
    dgmgrl sys/<pwd>@<database>
    DGMGRL> VALIDATE CONFIGURATION VERBOSE
    DGMGRL> VALIDATE DATABASE VERBOSE <PRIMARY>
    DGMGRL> VALIDATE DATABASE VERBOSE <STANDBY>
  2. Consulte la documentación de Oracle Database para consultar el mensaje de error respectivo. Por ejemplo:
    • ORA-16766: la aplicación de redo está parada.
    • ORA-16853: la demora de aplicación ha excedido el umbral especificado.
    • ORA-16664: no se ha podido recibir el resultado de un miembro (para la base de datos en espera).
    • ORA-12541: TNS: no hay listener (para la base de datos principal).

Para conocer la causa y la solución, revise los errores en Mensajes de error de Database.

Fallos de la aplicación de parches en sistemas Exadata Cloud Infrastructure

Las operaciones de aplicación de parches pueden fallar por diversos motivos. Normalmente, una operación falla porque un nodo de base de datos está caído, no hay suficiente espacio en el sistema de archivos o la máquina virtual no puede acceder al almacén de objetos.

Determinación del problema

En la consola, puede identificar una operación de aplicación de parches con fallos consultando el historial de parches de un sistema Exadata Cloud Infrastructure o una base de datos individual.

Un parche que no se ha aplicado correctamente muestra el estado Failed (Con fallos) e incluye una breve descripción del error que ha provocado el fallo. Si el mensaje de error no contiene suficiente información para sugerirle una solución, puede usar la CLI y los archivos log de la base de datos para recopilar más datos. A continuación, consulte la sección correspondiente de este tema para encontrar una solución.

Solución de problemas y diagnóstico

Diagnostique las incidencias más comunes que se pueden producir durante el proceso de aplicación de parches de cualquiera de los componentes de Exadata Cloud Infrastructure.

Incidencias en VM del servidor de base de datos

Una o varias de las siguientes condiciones en la VM del servidor de base de datos pueden provocar fallos en las operaciones de aplicación de parches.

Problemas de conectividad de la VM del servidor de base de datos

Las herramientas en la nube dependen de una configuración de conectividad y de red adecuada entre las máquinas virtuales de un cluster de VM. Si la configuración no está definida correctamente, puede que se produzcan fallos en todas las operaciones que requieren procesamiento entre nodos. Un ejemplo puede ser el no poder descargar los archivos necesarios para aplicar un parche determinado.

En ese caso, puede realizar las siguientes acciones:

  • Verifique que la configuración de DNS es correcta de forma que las direcciones de las máquinas virtuales relevantes se puedan resolver en el cluster de VM.
  • Consulte los logs de las herramientas en la nube relevantes, como se indica en la sección Obtención de asistencia adicional, y póngase en contacto con los Servicios de Soporte Oracle para obtener más ayuda.
Problemas de Oracle Grid Infrastructure

Una o varias de las siguientes condiciones en Oracle Grid Infrastructure pueden provocar fallos en las operaciones de aplicación de parches.

Oracle Grid Infrastructure está caído

Oracle Clusterware permite a los servidores comunicarse entre sí para que puedan funcionar como una unidad colectiva. El programa de software de cluster debe estar activo y en ejecución en el cluster de VM para que se completen las operaciones de aplicación de parches. En ocasiones, puede que necesite reiniciar Oracle Clusterware para resolver un fallo en la aplicación de parches.

En esos casos, verifique el estado de Oracle Grid Infrastructure de la siguiente manera:
./crsctl check cluster
CRS-4537: Cluster Ready Services is online
CRS-4529: Cluster Synchronization Services is online
CRS-4533: Event Manager is online
Si Oracle Grid Infrastructure está caído, reinícielo ejecutando los siguientes comandos:
crsctl start cluster -all
crsctl check cluster
Incidencias de las bases de datos de Oracle

Un estado de base de datos incorrecto puede producir fallos en la aplicación de parches.

Oracle Database está caído

La base de datos debe estar activa y en ejecución en todos los nodos activos para que las operaciones de aplicación de parches se puedan completar correctamente en todo el cluster.

Utilice el siguiente comando para comprobar el estado de la base de datos y asegúrese de que se resuelven los problemas que pueden haber ocasionado que la base de datos esté en un estado incorrecto:
srvctl status database -d db_unique_name -verbose

El sistema devuelve un mensaje que incluye el estado de la instancia de base de datos. El estado de la instancia debe ser Abierto para que la operación de aplicación de parches se realice correctamente.

Si la base de datos no se está ejecutando, utilice el comando siguiente para iniciarla:
srvctl start database -d db_unique_name -o open

Obtención de asistencia adicional

Si no ha podido resolver el problema con la información de este tema, siga los procedimientos siguientes para recopilar la información de diagnóstico y de bases de datos relevante. Una vez recabada la información, póngase en contacto con los Servicios de Soporte Oracle.

Temas relacionados

Recopilación de logs de herramientas en la nube

Utilice los archivos log relevantes que podrían ayudar a los Servicios de Soporte Oracle en una investigación más a fondo y la resolución de un problema determinado.

Logs de DBAASCLI

/var/opt/oracle/log/dbaascli
  • dbaascli.log

Recopilación de diagnósticos de Oracle

Para recopilar los logs y la información de diagnóstico relevantes de Oracle, ejecute el comando dbaascli diag collect.

Para obtener más información sobre el uso de esta utilidad, consulte Herramientas DBAAS: uso de dbaascli para recopilar registros de herramientas de nube y realizar una comprobación del sistema de las herramientas de nube.

La base de datos en espera no se puede reiniciar tras un switchover en la configuración de Oracle Data Guard en Oracle Database 11g

Descripción: Tras realizar el switchover, la nueva base de datos en espera (la anterior principal) sigue desconectada y no se puede reiniciar.

Acción: Tras realizar el switchover, haga lo siguiente:

  1. Reinicie la base de datos en espera con el comando srvctl start database -db <standby dbname>.
  2. Vuelva a cargar el listener como usuario grid en todos los nodos de cluster principales y en espera.
    • Para volver a cargar el listener con alta disponibilidad, descargue y aplique el parche 25075940 al directorio raíz de Grid. A continuación, ejecute lsnrctl reload -with_ha.
    • Para volver a cargar el listener, ejecute lsrnctl reload.

Después de volver a cargar el listener, verifique que los servicios <dbname>_DGMGRL estén cargados en el listener mediante el comando lsnrctl status.

Para descargar el parche 25075940

  1. Conéctese a My Oracle Support.
  2. Haga clic en Parches y actualizaciones.
  3. Seleccione Número de bug en la lista desplegable Número/Nombre o Número de bug (simple).
  4. Introduzca el número de bug 34741066 y, a continuación, haga clic en Buscar.
  5. En los resultados de búsqueda, haga clic en el nombre del último parche.

    Se le redirigirá a la página Parche 34741066: LSNRCTL RELOAD -WITH_HA NO HA PODIDO LEER LA ENTRADA ESTÁTICA EN LISTENER.ORA.

  6. Haga clic en Descargar.

Fallo intermitente en la creación de PDB al crear varias PDB en paralelo

Descripción: la creación de PDB puede fallar para el subjuego de PDB cuando se crean varias PDB en paralelo.

Causa: es posible que la creación de la PDB observe el siguiente error de forma intermitente.
ORA-03113: end-of-file on communication channel

Acción: vuelva a intentar la creación de la PDB fallida.