Solución de problemas de sistemas Exadata Cloud Infrastructure
En estos temas, se tratan algunos de los problemas comunes que se pueden experimentar y cómo abordarlos.
- Incidencias conocidas para Exadata Cloud Infrastructure
Incidencias conocidas generales. - Solución de problemas de conectividad de red
Para determinar si un cluster de VM está configurado correctamente para acceder a la red de servicios de Oracle Cloud Infrastructure (OCI), debe realizar los siguientes pasos en cada máquina virtual del cluster de VM. - Fallos de copia de seguridad en Exadata Database Service on Dedicated Infrastructure
Si la copia de seguridad gestionada por Exadata no se completa correctamente, puede utilizar los procedimientos de este tema para solucionar los problemas. - Solución de problemas de Oracle Data Guard
Aprenda a identificar y resolver problemas de Oracle Data Guard. - Fallos de la aplicación de parches en sistemas Exadata Cloud Infrastructure
- Obtención de asistencia adicional
- La base de datos en espera no se puede reiniciar tras un switchover en la configuración de Oracle Data Guard en Oracle Database 11g
- Fallo intermitente en la creación de PDB al crear varias PDB en paralelo
Tema principal: Guías de referencia para Exadata Cloud Infrastructure
Incidencias conocidas de Exadata Cloud Infrastructure
Incidencias conocidas generales.
Tema principal: Solución de problemas de sistemas Exadata Cloud Infrastructure
Fallo de escalado fuera de línea de la CPU
** CPU Scale Update **An error occurred during module execution. Please refer to the log file for more information
Causa: después de aprovisionar un cluster de VM, el archivo /var/opt/oracle/cprops/cprops.ini
, generado automáticamente por la base de datos como servicio (DBaaS), no se actualiza con los parámetros common_dcs_agent_bindHost
y common_dcs_agent_port
y esto hace que falle el escalado fuera de línea de la CPU.
root
, agregue manualmente las siguientes entradas en el archivo /var/opt/oracle/cprops/cprops.ini
.common_dcs_agent_bindHost=<IP_Address>
common_dcs_agent_port=7070
El valor
common_dcs_agent_port
es siempre 7070.
netstat -tunlp | grep 7070
netstat -tunlp | grep 7070
tcp 0 0 <IP address 1>:7070 0.0.0.0:* LISTEN 42092/java
tcp 0 0 <IP address 2>:7070 0.0.0.0:* LISTEN 42092/java
Puede especificar una cualquiera de las dos direcciones IP, <IP address 1> o <IP address 2>, para el parámetro common_dcs_agent_bindHost
.
Tema principal: Incidencias conocidas de Exadata Cloud Infrastructure
Fallo al agregar una VM a un cluster de VM
[FATAL] [INS-32156] Installer has detected that there are non-readable files in oracle home. CAUSE: Following files are non-readable, due to insufficient permission oracle.ahf/data/scaqak03dv0104/diag/tfa/tfactl/user_root/tfa_client.trc ACTION: Ensure the above files are readable by grid.
Causa: el instalador ha detectado un archivo de rastreo no legible, oracle.ahf/data/scaqak03dv0104/diag/tfa/tfactl/user_root/tfa_client.trc
, creado por Autonomous Health Framework (AHF) en el directorio raíz de Oracle que provoca un fallo al agregar una VM de cluster.
AHF ejecutado como root
ha creado un archivo trc
con propiedad root
que el usuario grid
no puede leer.
grid
antes de agregar las VM a un cluster de VM. Para solucionar la incidencia de permiso, ejecute los siguientes comandos como root
en todas las VM de cluster de VM existentes:chown grid:oinstall /u01/app/19.0.0.0/grid/srvm/admin/logging.properties
chown -R grid:oinstall /u01/app/19.0.0.0/grid/oracle.ahf*
chown -R grid:oinstall /u01/app/grid/oracle.ahf*
Tema principal: Incidencias conocidas de Exadata Cloud Infrastructure
Solución de problemas de conectividad de red
Para determinar si un cluster de VM está configurado correctamente para acceder a la red de servicios de Oracle Cloud Infrastructure (OCI), debe realizar los siguientes pasos en cada máquina virtual del cluster de VM.
Comprobación de validación de la conectividad de gestión de identidades y accesos:
- Aplique
ssh
a una máquina virtual del cluster de VM ExaDB-D como usuario opc. - Ejecute el comando:
curl https://identity.<region>.oci.oraclecloud.com
, donde <region> se corresponde con la región de OCI donde se despliega el cluster de VM. Si el cluster de VM se despliega en la región de Ashburn, debe utilizar "us-ashburn-1" para <region>. El comando curl ahora tendrá el aspectocurl https://identity.us-ashburn-1.oci.oraclecloud.com
. - Si la red virtual en la nube (VCN) está configurada correctamente para acceder a la red de servicios de OCI, obtendrá una respuesta inmediata similar a la que se muestra
{ "code" : "NotAuthorizedOrNotFound", "message" : "Authorization failed or requested resource not found." }
- La sesión ssh se bloqueará y se producirá un timeout si la red no está configurada para acceder a los servicios de OCI
- En función de la configuración de la VCN, deberá seguir los pasos descritos en la sección de acción siguiente para configurar el acceso a la red de servicios de OCI.
Comprobación de validación de la conectividad del servicio Object Storage (OSS):
- Aplique ssh a una máquina virtual del cluster de VM ExaDB-D como usuario
opc
. - Ejecute el comando:
curl https://objectstorage.<region>.oraclecloud.com
, donde <region> corresponde a la región de OCI donde se despliega el cluster de VM. Si el cluster de VM se despliega en la región de Ashburn, debe utilizar "us-ashburn-1" para <region>. El comando curl ahora se parecerá acurl https://objectstorage.us-ashburn-1.oraclecloud.com
. - Si la red virtual en la nube (VCN) está configurada correctamente para acceder a la red de servicios de OCI, obtendrá una respuesta inmediata similar a la que se muestra
{ "code" : "NotAuthorizedOrNotFound", "message" : "Authorization failed or requested resource not found." }
- La sesión ssh se bloqueará y se producirá un timeout si la red no está configurada para acceder a los servicios de OCI
- En función de la configuración de la VCN, deberá seguir los pasos descritos en la sección de acción siguiente para configurar el acceso a la red de servicios de OCI.
Acción:
- Esta acción se aplica a los clientes que han desplegado su cluster de VM en una subred privada.
Si aún no ha configurado un gateway de servicio para acceder a la red de servicios de OCI, utilice las instrucciones de la documentación para configurar un gateway de servicio para que lo utilice el cluster de VM a fin de acceder a los servicios de OCI https://docs.oracle.com/en/engineered-systems/exadata-cloud-service/ecscm/ecs-network-setup.html#GUID-51C3EC2C-20DA-4EE5-B882-CD500FA6F7C6
- Esta acción se aplica a los clientes que han desplegado su cluster de VM en una subred pública.
Si aún no ha configurado un gateway de Internet para acceder a la red de servicios de OCI, utilice las instrucciones de la documentación para configurar el gateway de Internet para que lo utilice el cluster de VM a fin de acceder a los servicios de OCI https://docs.oracle.com/en/engineered-systems/exadata-cloud-service/ecscm/ecs-network-setup.html#GUID-D8296957-E344-4688-B626-42A99E1D164B
Una vez que configure la VCN para acceder a la red de servicios de OCI siguiendo las instrucciones anteriores, ejecute los pasos de ambas secciones Comprobación de validación para asegurarse de que ha establecido la conectividad a la red de servicios de OCI desde el cluster de VM.
Información adicional:
Puede encontrar instrucciones para actualizar un gateway de servicio aquí (https://docs.oracle.com/en-us/iaas/Content/Network/Tasks/servicegateway.htm#switch_label)
Tema principal: Solución de problemas de sistemas Exadata Cloud Infrastructure
Fallos de copia de seguridad en Exadata Database Service on Dedicated Infrastructure
Si la copia de seguridad gestionada por Exadata no se completa correctamente, puede utilizar los procedimientos de este tema para solucionar los problemas.
Las causas más comunes de fallos de copias de seguridad son las siguientes:
- El host no puede acceder a Object Storage
- La configuración de la base de datos en el host no es correcta
La información siguiente está organizada por las distintas condiciones de error. Si ya sabe la causa, puede ir a la sección con la solución sugerida. De lo contrario, utilice el procedimiento descrito en Determinación del problema para comenzar.
- Determinación del problema
En la consola, una copia de seguridad de base de datos con fallos muestra el estado Con fallos o se bloquea en el estado Copia de seguridad en curso o Creando. - Problemas del agente del servicio de base de datos
Su base de datos Oracle Cloud Infrastructure utiliza un marco de agente para que pueda gestionar su base de datos a través de la plataforma en la nube. Utilice lo siguiente para comprobar y reiniciardbcsagent
. - Incidencias de conectividad del almacén de objetos
Para realizar una copia de seguridad de la base de datos en Oracle Cloud Infrastructure Object Storage, es necesario que el host se pueda conectar al punto final de Swift aplicable. - Incidencias del host
Una o varias de las siguientes condiciones en el host de la base de datos pueden provocar fallos en las copias de seguridad. - Incidencias de la base de datos
Una configuración o estado de la base de datos incorrectos pueden provocar fallos en las copias de seguridad. - Fallos de copia de seguridad y cartera de TDE
Aprenda a identificar la causa raíz de los fallos de copia de seguridad y cartera de TDE.
Tema principal: Solución de problemas de sistemas Exadata Cloud Infrastructure
Determinación del problema
En la consola, una copia de seguridad de base de datos con fallos muestra el estado Con fallos o se bloquea en el estado Copia de seguridad en curso o Creando.
Si el mensaje de error no contiene suficiente información para darle una solución, puede recopilar más información utilizando dbaascli
y consultando los archivos log. A continuación, consulte la sección correspondiente de este tema para encontrar una solución.
Las copias de seguridad de la base de datos pueden fallar durante la etapa de configuración de RMAN
o durante un trabajo de copia de seguridad deRMAN
en ejecución. Las tareas de configuración de RMAN
incluyen la validación de la conectividad del destino de copia de seguridad, la instalación del módulo de copia de seguridad y los cambios de configuración de RMAN
. Los archivos log que examine dependen de la etapa en la que se produzca el fallo.
- Inicie sesión en el host como usuario
oracle
. - Consulte el archivo log aplicable:
- Para identificar el ID de trabajo de una copia de seguridad automatizada, utilice el comando
dbaascli database backup --dbname <dbname> --showHistory
. Muestra el historial de todos los trabajos de copia de seguridad, incluidos sus correspondientes ID de trabajo. - Los logs de trabajos están disponibles en
/var/opt/oracle/log/dtrs/jobs/
, denominado con el formato<job_id>.log
. Si un trabajo falla, también se genera un log de depuración correspondiente<job_id>.debug
en la misma ubicación. - Puede encontrar los logs de ejecución del comando
RMAN
correspondientes para las operaciones de copia de seguridad, recuperación y configuración en el directorio/var/opt/oracle/log/<dbname>/dtrs/rman/bkup
.
- Para identificar el ID de trabajo de una copia de seguridad automatizada, utilice el comando
Asegúrese de revisar los archivos log en todos los nodos de cálculo del sistema de base de datos de Exadata.
Incidencias del agente de Database Service
Su base de datos Oracle Cloud Infrastructure utiliza un marco de agente para que pueda gestionar su base de datos a través de la plataforma en la nube. Utilice lo siguiente para comprobar y reiniciar dbcsagent
.
En ocasiones, puede que necesite reiniciar el programa dbcsagent
si tiene el estado parada/en espera para resolver un fallo de copia de seguridad. Consulte el archivo /opt/oracle/dcs/log/dcs-agent.log
para identificar las incidencias relacionadas con el agente.
- Desde un símbolo del sistema, compruebe el estado del agente:
systemctl status dbcsagent.service
- Si el agente tiene el estado parada/en espera, intente reiniciar el agente:
systemctl start dbcsagent.service
- Vuelva a comprobar el estado del agente para confirmar que tiene el estado parada/en ejecución:
systemctl status dbcsagent.service
Incidencias de conectividad del almacén de objetos
Para realizar una copia de seguridad de la base de datos en Oracle Cloud Infrastructure Object Storage, es necesario que el host se pueda conectar al punto final de Swift aplicable.
Aunque Oracle controla las credenciales de usuario de Swift reales para el cubo de almacenamiento para copias de seguridad gestionadas, verificar la conectividad general a Object Storage en su región es un buen indicador de que la conectividad del almacén de objetos no es la raíz del problema. Puede probar esta conectividad con otro usuario de Swift.
- Cree un usuario de Swift en su arrendamiento. Consulte Trabajar con token de autenticación.
- Con el usuario que ha creado en el paso anterior, utilice el siguiente comando para verificar que el host puede acceder al almacén de objetos.
Consulte Preguntas frecuentes sobre Object Storage para conocer la región correcta que se debe utilizar. Consulte Descripción de los espacios de nombres de Object Storage para obtener información sobre el espacio de nombres de Object Storage.curl -v -X HEAD -u <user_ID>:'<auth_token>' https://swiftobjectstorage.<region_name>.oraclecloud.com/v1/<object_storage_namespace>
- Si no se puede conectar al almacén de objetos, consulte el tema Requisitos para copias de seguridad en Exadata Cloud Service para obtener información sobre la configuración de la conectividad del almacén de objetos.
Incidencias del host
Una o varias de las siguientes condiciones en el host de la base de datos pueden provocar fallos en las copias de seguridad.
Si un comando interactivo como oraenv
, o cualquier comando que pueda devolver un mensaje de error o advertencia, se ha agregado al archivo .bash_profile
para el usuario grid u oracle, las operaciones del servicio Database como las copias de seguridad automáticas se pueden interrumpir sin haber finalizado. Consulte el archivo .bash_profile
para estos comandos y elimínelos.
Las operaciones de copia de seguridad requieren espacio en el directorio /u01
del sistema de archivos del host. Utilice el comando df -h
en el host para comprobar el espacio disponible para las copias de seguridad. Si el sistema de archivos no tiene espacio suficiente, puede eliminar archivos de rastreo o archivos log antiguos para liberar espacio.
Puede que el sistema no tenga la versión necesaria del módulo de copia de seguridad (opc_installer.jar
). Consulte No se han podido utilizar las copias de seguridad gestionadas en el sistema de base de datos para obtener más información sobre este problema conocido. Para corregir el problema, puede seguir el procedimiento de esa sección o simplemente actualizar el sistema de base de datos y la base de datos con el último paquete de parches.
La personalización del archivo de perfil de ubicación ($ORACLE_HOME/sqlplus/admin/glogin.sql
) puede hacer que las copias de seguridad gestionadas fallen en Oracle Cloud Infrastructure. En concreto, los comandos interactivos pueden producir fallos en las copias de seguridad. Oracle recomienda no modificar este archivo para bases de datos alojadas en Oracle Cloud Infrastructure.
Incidencias de la base de datos
Una configuración o estado de la base de datos incorrectos pueden provocar fallos en las copias de seguridad.
La base de datos debe estar activa y en ejecución (lo ideal es en todos los nodos) mientras la copia de seguridad está en curso.
srvctl status database -d <db_unique_name> -verbose
Open
para que la copia de seguridad se realice correctamente. Si la base de datos no se está ejecutando, utilice el comando siguiente para iniciarla:
srvctl start database -d <db_unique_name> -o open
Open
, utilice los siguientes comandos para acceder al símbolo del sistema de SQL*Plus y definir el estado en Open
:
sqlplus / as sysdba
alter database open;
Al aprovisionar una nueva base de datos, el modo de archivado se define en ARCHIVELOG
por defecto. Este es el modo de archivado necesario para las operaciones de copia de seguridad. Si corresponde, compruebe el ajuste de modo de archivado de la base de datos y cámbielo a ARCHIVELOG
.
select log_mode from v$database;
ARCHIVELOG
, inicie la base de datos en estado MOUNT
(y no en estado OPEN
) y utilice el siguiente comando en el símbolo del sistema de SQL*Plus:
alter database archivelog;
Confirme que el parámetro db_recovery_file_dest
apunta a +RECO
y que el parámetro log_archive_dest_1
está ajustado en USE_DB_RECOVERY_FILE_DEST
.
Para bases de datos RAC, una instancia debe tener el estado MOUNT
al activar el modo archivelog. Para activar el modo archivelog para una base de datos RAC, realice los siguientes pasos:
- Cierre todas las instancias de base de datos:
srvctl stop database -d
- Inicie una de las instancias de base de datos en estado MOUNT:
srvctl start instance -d <db_unique_name> -i <instance_name> -o mount
- Acceda al símbolo del sistema de SQL*Plus:
sqlplus / as sysdba
- Active el modo de archive log:
alter database archivelog; exit;
- Pare la base de datos:
srvctl stop instance -d <db_unique_name> -i <instance_name>
- Reinicie todas las instancias de base de datos:
srvctl start database -d <db_unqiue_name>
- En el símbolo del sistema de SQL*Plus, confirme que el modo de archivado está configurado en:
ARCHIVELOG
:select log_mode from v$database;
srvctl status database -db <db_unique_name> -v
. Si el comando devuelve la siguiente salida, debe resolver la incidencia del proceso de archivador parado para que las copias de seguridad se realicen correctamente:
Instance <instance_identifier> is running on node *<node_identifier>. Instance status: Stuck Archiver
Consulte ORA-00257: error de archivador (ID de documento 2014425.1) para obtener información sobre la resolución de un proceso de archivador parado.
Instance <instance_identifier> is running on node *<node_identifier>. Instance status: Open
Si el estado de la instancia no cambia después de resolver la incidencia subyacente con el dispositivo o recurso lleno o no disponible, intente reiniciar la base de datos mediante el comando srvctl
para actualizar el estado de la base de datos en el clusterware.
La edición de algunos parámetros de configuración de RMAN puede producir fallos de copia de seguridad en Oracle Cloud Infrastructure. Para comprobar la configuración de RMAN, utilice el comando show all
en el símbolo del sistema de la línea de comandos de RMAN.
Consulte la siguiente lista de parámetros para obtener más información sobre los valores de configuración de RMAN que no se deben modificar para las bases de datos en Oracle Cloud Infrastructure.
CONFIGURE RETENTION POLICY TO RECOVERY WINDOW OF 30 DAYS;
CONFIGURE CONTROLFILE AUTOBACKUP ON;
CONFIGURE DEVICE TYPE 'SBT_TAPE' PARALLELISM 5 BACKUP TYPE TO COMPRESSED BACKUPSET;
CONFIGURE CHANNEL DEVICE TYPE DISK MAXPIECESIZE 2 G;
CONFIGURE CHANNEL DEVICE TYPE 'SBT_TAPE' PARMS 'SBT_LIBRARY=/var/opt/oracle/dbaas_acfs/<db_name>/opc/libopc.so, ENV=(OPC_PFILE=/var/opt/oracle/dbaas_acfs/<db_name>/opc/opc<db_name>.ora)';
CONFIGURE ARCHIVELOG DELETION POLICY TO BACKED UP 1 TIMES TO 'SBT_TAPE';
CONFIGURE CHANNEL DEVICE TYPE DISK MAXPIECESIZE 2 G;
CONFIGURE ENCRYPTION FOR DATABASE ON;
Las copias de seguridad de RMAN fallan cuando se pierde un archivo de cartera del almacén de objetos. El archivo de cartera es necesario para activar la conectividad al almacén de objetos.
-
Obtenga el nombre de la base de datos con el fallo de copia de seguridad mediante SQL*Plus:
show parameter db_name
-
Determine la ruta de acceso del archivo de parámetros de configuración de copia de seguridad que contiene la información de la cartera de RMAN en la línea de comandos de Linux:
locate opc_<database_name>.ora
Por ejemplo:find / -name "opctestdb30.ora" -print /var/opt/oracle/dbaas_acfs/testdb30/opc/opctestdb30.ora
-
Busque la ruta de archivo en el archivo de cartera en el archivo de parámetros de configuración de copia de seguridad inspeccionando el valor almacenado en el parámetro
OPC_WALLET
. Para ello, vaya al directorio que contiene el archivo de parámetros de configuración de copia de seguridad y utilice el siguiente comandocat
:cat opc<database_name>.ora
Por ejemplo:cd /var/opt/oracle/dbaas_acfs/testdb30/opc/
ls -altr *.ora opctestdb30.ora
cat opctestdb30.ora OPC_HOST=https://swiftobjectstorage.us-phoenix-1.oraclecloud.com/v1/dbbackupphx OPC_WALLET='LOCATION=file:/var/opt/oracle/dbaas_acfs/testdb30/opc/opc_wallet CREDENTIAL_ALIAS=alias_opc' OPC_CONTAINER=bUG3TFsSi8QzjWfuTxqqExample _OPC_DEFERRED_DELETE=false
-
Confirme que el archivo
cwallet.sso
existe en el directorio especificado en el parámetroOPC_WALLET
y confirme que el archivo tiene los permisos correctos. Los permisos de archivo deben tener el valor octal "600" (-rw-------
). Utilice el comando siguiente:ls -ltr /var/opt/oracle/dbaas_acfs/<database_name>/opc/opc_wallet
Por ejemplo:ls -altr /var/opt/oracle/dbaas_acfs/testdb30/opc/opc_wallet -rw------- 1 oracle oinstall 0 Oct 29 01:59 cwallet.sso.lck -rw------- 1 oracle oinstall 111231 Oct 29 01:59 cwallet.sso
Cartera TDE y fallos de copia de seguridad
Aprenda a identificar la causa raíz de los fallos de copia de seguridad y cartera de TDE.
$ORACLE_HOME/network/admin/sqlnet.ora
debe contener el parámetro ENCRYPTION_WALLET_LOCATION
con el siguiente formato:ENCRYPTION_WALLET_LOCATION=(SOURCE=(METHOD=FILE)(METHOD_DATA=(DIRECTORY=/var/opt/oracle/dbaas_acfs/<database_name>/tde_wallet)))
cat
para comprobar la especificación de ubicación de cartera de TDE. Por ejemplo:$ cat $ORACLE_HOME/network/admin/sqlnet.ora
ENCRYPTION_WALLET_LOCATION=(SOURCE=(METHOD=FILE)(METHOD_DATA=(DIRECTORY=/var/opt/oracle/dbaas_acfs/<database_name>/tde_wallet)))
Las copias de seguridad de la base de datos fallan si la cartera de TDE no tiene el estado adecuado. Los siguientes escenarios pueden provocar este problema:
Si la base de datos se ha iniciado mediante SQL*Plus y no se ha definido la variable de entorno ORACLE_UNQNAME
, la cartera no se abre correctamente.
srvctl
:srvctl start database -d <db_unique_name>
En un entorno multiinquilino para versiones de Oracle Database que soporten el almacén de claves de nivel PDB, cada PDB tiene su propia clave de cifrado maestra. Para bases de datos de Oracle 18c, esta clave de cifrado se almacena en un único almacén de claves utilizado por todos los contenedores. (Oracle Database 19c no soporta un almacén de claves en el nivel de la PDB.) Después de crear o conectar una nueva PDB, debe crear y activar una clave de cifrado maestra para ella. Si no lo hace, la columna STATUS
de la vista v$encryption_wallet
mostrará el valor OPEN_NO_MASTER_KEY
.
Para comprobar el estado de la clave de cifrado maestra y crear una clave maestra, realice lo siguiente:
-
Revise la columna
STATUS
en la vistav$encryption_wallet
, como se muestra en el siguiente ejemplo:SQL> alter session set container=pdb2; Session altered. SQL> select WRL_TYPE,WRL_PARAMETER,STATUS,WALLET_TYPE from v$encryption_wallet; WRL_TYPE WRL_PARAMETER STATUS WALLET_TYPE ---------- ----------------------------------------------- ------------------ ----------- FILE /var/opt/oracle/dbaas_acfs/testdb30/tde_wallet/ OPEN_NO_MASTER_KEY AUTOLOGIN
-
Confirme que la PDB está en modo READ WRITE y que no está restringida, como se muestra en el siguiente ejemplo:
SQL> show pdbs CON_ID CON_NAME OPEN MODE RESTRICTED ------ ------------ ---------------------- --------------- 2 PDB$SEED READ ONLY NO 3 PDB1 READ WRITE NO 4 PDB2 READ WRITE NO
La PDB no puede estar abierta en modo restringido (la columna
RESTRICTED
debe mostrarNO
). Si la PDB está en modo restringido actualmente, revise la información en la vistaPDB_PLUG_IN_VIOLATIONS
y resuelva la incidencia antes de continuar. Para obtener más información sobre la vistaPDB_PLUG_IN_VIOLATIONS
y el estado restringido, consulte la Oracle Multitenant Administrator’s Guide sobre la base de datos conectable para su versión de base de datos Oracle. -
Cree y active una clave de cifrado maestra para la PDB:
- Defina el contenedor en la PDB:
ALTER SESSION SET CONTAINER = <pdb>;
- Para crear y activar una clave de cifrado maestra en la PDB, ejecute el siguiente comando:
ADMINISTER KEY MANAGEMENT SET KEY USING TAG '<tag>' FORCE KEYSTORE IDENTIFIED BY <keystore-password> WITH BACKUP USING '<backup_identifier>';
Tenga en cuenta lo siguiente:
- La cláusula opcional
USING TAG
se puede utilizar para asociar una etiqueta a la nueva clave de cifrado maestra. -
La cláusula
WITH BACKUP
es opcional y se puede utilizar para crear una copia de seguridad del almacén de claves antes de crear la nueva clave de cifrado maestra.
También puede utilizar los comandos
dbaascli
,dbaascli tde status
ydbaascli tde rotate masterkey
para investigar y gestionar las claves. - Defina el contenedor en la PDB:
-
Confirme que el estado de la cartera ha cambiado de
OPEN_NO_MASTER_KEY
a OPEN consultando la vistav$encryption_wallet
como se muestra en el paso 1.
Los parámetros de configuración relacionados con la cartera de TDE pueden provocar fallos en las copias de seguridad.
open
y que el tipo de cartera es auto login
consultando la vista v$encryption_wallet
. Por ejemplo:
SQL> select status, wrl_parameter,wallet_type from v$encryption_wallet;
STATUS WRL_PARAMETER WALLET_TYPE
------- ---------------------------------------------- --------------
OPEN /var/opt/oracle/dbaas_acfs/testdb30/tde_wallet/ AUTOLOGIN
v$encryption_wallet
. Por ejemplo:
$ sqlplus / as sysdba
SQL> alter session set container=pdb1;
Session altered.
SQL> select WRL_TYPE,WRL_PARAMETER,STATUS,WALLET_TYPE from v$encryption_wallet;
WRL_TYPE WRL_PARAMETER STATUS WALLET_TYPE
--------- ----------------------------------------------- -------- -----------
FILE /var/opt/oracle/dbaas_acfs/testdb30/tde_wallet/ OPEN AUTOLOGIN
ewallet.p12
) puede hacer que las copias de seguridad fallen si falta, o si los permisos o la propiedad del sistema de archivos no son compatibles. Compruebe el archivo como se muestra en el siguiente ejemplo como usuario root
:
# ls -altr /var/opt/oracle/dbaas_acfs/<database_name>/tde_wallet/ewallet.p12
total 76
-rw------ 1 oracle oinstall 5467 Oct 1 20:17 ewallet.p12
El archivo de cartera de TDE debe tener permisos de archivo con el valor octal "600" (-rw-------
) y el propietario de este archivo debe formar parte del grupo del sistema operativo oinstall
.
cwallet.sso
) puede hacer que las copias de seguridad fallen si falta, o si los permisos o la propiedad del sistema de archivos no son compatibles. Compruebe el archivo como se muestra en el siguiente ejemplo como usuario root
:
# ls -altr /var/opt/oracle/dbaas_acfs/<database_name>/tde_wallet/cwallet.sso
total 76
-rw------ 1 oracle oinstall 5512 Oct 1 20:18 cwallet.sso
El archivo de cartera de conexión automática debe tener permisos de archivo con el valor octal "600" (-rw-------
), y el propietario de este archivo debe formar parte del grupo del sistema operativo oinstall
.
Solución de problemas de Oracle Data Guard
Aprenda a identificar y resolver problemas de Oracle Data Guard.
Al solucionar problemas de Oracle Data Guard, primero debe determinar si el problema se produce durante la configuración e inicialización de Data Guard o durante la operación de Data Guard, cuando se introducen comandos de ciclo de vida. Los pasos para identificar y resolver los problemas son diferentes, dependiendo del escenario en el que se utilicen.
Hay tres operaciones de ciclo de vida: switchover, failover y reinstate. Data Guard Broker se utiliza para todos estos comandos. La interfaz de línea de comandos de broker (dgmgrl
) es la herramienta principal que se utiliza para identificar y solucionar los problemas. Aunque puede utilizar archivos log para identificar las causas raíz, dgmgrl
es más rápido y fácil de utilizar para comprobar e identificar una incidencia.
La configuración y activación de Data Guard implica varios pasos. Se crean archivos log para cada paso. Si alguno de los pasos falla, revise el archivo log correspondiente para identificar y solucionar el problema.
- Validación de la base de datos y del cluster de VM en la nube principal
- Validación del cluster de VM en la nube en espera
- Nueva creación y copia de archivos en la base de datos en espera (archivo de contraseñas y carteras)
- Creación de Data Guard a través de la red (comando RMAN Duplicate)
- Configuración de Data Guard Broker
- Finalización de la configuración
- Resolución de problemas de Data Guard mediante archivos log
Las herramientas utilizadas para identificar el problema y las ubicaciones de los archivos log relevantes son diferentes, dependiendo del escenario en el que se utilicen. - Solución de problemas del proceso de configuración de Data Guard
Se pueden producir los siguientes errores en los diferentes pasos del proceso de configuración de Data Guard. Mientras que algunos errores se muestran dentro de la consola, la mayoría de las causas raíz se pueden encontrar en los archivos log
Tema principal: Solución de problemas de sistemas Exadata Cloud Infrastructure
Solución de problemas de Data Guard mediante archivos log
Las herramientas utilizadas para identificar el problema y las ubicaciones de los archivos log relevantes son diferentes, dependiendo del escenario en el que se utilicen.
Utilice los siguientes procedimientos para recopilar los archivos log pertinentes para investigar las incidencias. Si no puede resolver el problema después de consultar los archivos log, póngase en contacto con My Oracle Support.
Al preparar archivos recopilados para los Servicios de Soporte Oracle, agréguelos en un archivo comprimido, como un archivo ZIP.
En cada nodo de recursos informáticos asociado a la configuración de Data Guard, recopile archivos log pertenecientes al problema que ha experimentado.
- Archivos log de etapa de activación (como los que documentan la operación de creación de base de datos en espera) y logs del sistema principal o en espera correspondiente.
- Archivos log de ID de trabajo de activación. Por ejemplo: 23.
- Ubicaciones de archivos log de activación por etapa de activación y sistema de Exadata (principal o en espera).
- Archivos log de nombres de base de datos (
db_name
odb_unique_name
, según la ruta del archivo).
Compruebe todos los nodos de los sistemas de Exadata principales y en espera correspondientes. Los comandos ejecutados en un sistema pueden haberse ejecutado en cualquiera de sus nodos.
Data Guard Deployer (DGdeployer
) es el proceso que realiza la configuración. Al configurar la base de datos principal, se crea el archivo /var/opt/oracle/log/<dbname>/dgdeployer/dgdeployer.log
.
Este log debe contener la causa raíz de un fallo al configurar la base de datos principal.
- El log principal de la utilidad de línea de comandos
dbaasapi
es:/var/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log
. Busque entradas que contengandg_api
. - Un log en espera de la utilidad de línea de comandos
dbaasapi
es:/var/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log
. En este log, busque entradas que contengandg_api
. - El otro log en espera es:
/var/opt/oracle/log/<dbname>/dgcc/dgcc.log
. Este log es el log de configuración de Data Guard.
- El motor de despliegue de Oracle Cloud (ODCE) crea el archivo
/var/opt/oracle/log/<dbname>/ocde/ocde.log
. Este log debe contener la causa de un fallo al crear la base de datos en espera. - La utilidad de línea de comandos
dbaasapi
crea el archivovar/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log
. Busque entradas que contengandg_api
. - El archivo log de configuración de Data Guard es
/var/opt/oracle/log/<dbname>/dgcc/dgcc.log
.
DGdeployer
es el proceso que realiza la configuración. Crea el siguiente archivo/var/opt/oracle/log/<dbname>/dgdeployer/dgdeployer.log
. Este log debe contener la causa raíz de un fallo al configurar la base de datos en espera.- La utilidad de línea de comandos
dbaasapi
crea el archivo/var/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log
. Busque entradas que contengandg_api
. - El log de configuración de Data Guard es
/var/opt/oracle/log/<dbname>/dgcc/dgcc.log
.
DGdeployer
es el proceso que realiza la configuración. Al configurar Data Guard, crea el archivo /var/opt/oracle/log/<dbname>/dgdeployer/dgdeployer.log
. Este log debe contener la causa raíz de un fallo al configurar la base de datos principal.
En cada nodo de los sitios principales y en espera, recopile archivos log para el nombre de base de datos relacionado (db_name
).
Compruebe todos los nodos en los sistemas Exadata principales y en espera. Una operación de gestión del ciclo de vida puede afectar tanto a sistemas principales como en espera.
- Log de alertas de base de datos:
/u02/app/oracle/diag/rdbms/<dbname>/<dbinstance>/trace/alert_<dbinstance>.log
- Log de Data Guard Broker:
/u02/app/oracle/diag/rdbms/<dbname>/<dbinstance>/trace/drc<dbinstance>.log
- Archivo log de herramientas de nube para Data Guard:
/var/opt/oracle/log/<dbname>/odg/odg.log
Tema principal: Solución de problemas de Oracle Data Guard
Solución de problemas del proceso de configuración de Data Guard
Se pueden producir los siguientes errores en los diferentes pasos del proceso de configuración de Data Guard. Mientras que algunos errores se muestran dentro de la consola, la mayoría de las causas raíz se pueden encontrar en los archivos log
La contraseña introducida para activar Data Guard no coincide con la contraseña de administrador principal para el usuario SYS. Este error se produce durante la etapa de activación Validar principal.
Puede que la base de datos no esté en ejecución. Este error se produce durante la etapa de activación Validar principal. Compruebe con srvctl
y sql
en el host para verificar que la base de datos está activa y en ejecución en todos los nodos.
No se ha podido configurar la base de datos principal. Los comandos de Data Guard no válidos o la nueva configuración con fallos del listener pueden provocar este error.
No se ha podido crear la cartera de TDE. No se han podido preparar los archivos del almacén de claves (cartera) de cifrado de datos transparente (TDE) de Oracle para el transporte al sitio en espera. Este error se produce durante la etapa de activación Crear cartera de TDE. Cualquiera de los siguientes elementos puede provocar un fallo en esta etapa:
- No se ha podido acceder a los archivos de cartera de TDE
- Los comandos de activación no han podido crear un archivo que contenga los archivos de cartera
Procedimientos de solución de problemas:
- Asegúrese de que se puede acceder al cluster. Para comprobar el estado de un cluster, ejecute el siguiente comando:
crsctl check cluster -all
- Si el cluster está caído, ejecute el siguiente comando para reiniciarlo:
crsctl start crs -wait
- Si este error se produce cuando se puede acceder al cluster, consulte los logs para crear la cartera de TDE (fase de activación) para determinar la causa y la resolución del error.
Es probable que el archivo que contiene la cartera TDE no se transmitiera al sitio en espera. Volver a intentarlo suele resolver el problema.
- Es posible que los sitios principales y en espera no se puedan comunicar entre sí para configurar la base de datos en espera. Estos errores se producen durante la etapa de activación Configurar base de datos en espera. En esta etapa, las configuraciones se realizan en la base de datos en espera, incluido el comando rman duplicate de la base de datos principal. Para resolver esta incidencia:
- Verifique el estado de conectividad de los sitios principales y en espera.
- Asegúrese de que el host se puede comunicar desde el puerto 1521 con todos los puertos. Compruebe la configuración de red, incluidos los grupos de seguridad de red (NSG), las listas de seguridad de red y la configuración de intercambio de tráfico de VCN remoto (si corresponde). La mejor manera de probar la comunicación entre el host y otros nodos es acceder a las bases de datos mediante SQL*PLUS desde la principal a la en espera y desde la espera a la principal.
- Es posible que las VIP SCAN o los listeners no se estén ejecutando. Utilice la prueba anterior para ayudar a identificar el problema.
Causas posibles:
- Es posible que las VIP SCAN o los listeners no se estén ejecutando. Puede confirmar esta incidencia mediante los siguientes comandos en cualquier nodo de cluster.
-
[grid@exa1-****** ~]$ srvctl status scan
-
[grid@exa1-****** ~]$ srvctl status scan_listener
-
- Tal vez no se pueda acceder a las bases de datos. Puede confirmar este problema intentando conectarse mediante un alias de Oracle Net existente.
Procedimientos de solución de problemas:
- Como usuario oracle OS, compruebe la existencia de un alias de Oracle Net para la base de datos de contenedor (CDB). Busque un alias en $ORACLE_HOME/network/admin/<dbname>/tnsnames.ora.
En el siguiente ejemplo, se muestra una entrada para una base de datos de contenedores denominada db12c:
cat $ORACLE_HOME/network/admin/db12c/tnsnames.ora DB12C = (DESCRIPTION =(ADDRESS = (PROTOCOL = TCP)(HOST = exa1-*****-scan.********.******.******.com)(PORT = 1521)) (CONNECT_DATA = (SERVER = DEDICATED) (SERVICE_NAME = db12c.********.******.******.com) (FAILOVER_MODE = (TYPE = select) (METHOD = basic))))
- Verifique que puede utilizar el alias para conectarse a la base de datos. Por ejemplo, como sysdba, introduzca el siguiente comando:
sqlplus sys@db12c
Una causa posible de este error es que las contraseñas de usuario sys o system de Oracle Database para la base de datos y la cartera de TDE no sean las mismas. Para comparar las contraseñas:
- Conéctese a la base de datos como usuario sys y compruebe el estado de TDE en
.V$ENCRYPTION_WALLET
- Conéctese a la base de datos como usuario system y compruebe el estado de TDE en
.V$ENCRYPTION_WALLET
- Actualice las contraseñas correspondientes para que coincidan. Inicie sesión en el host del sistema como opc y ejecute los siguientes comandos:
- Para cambiar la contraseña SYS:
sudo dbaascli database changepassword --dbname <database_name>
- Para cambiar la contraseña de la cartera de TDE:
sudo dbaascli tde changepassword --dbname <database_name>
- Para cambiar la contraseña SYS:
Para conocer las posibles causas y resoluciones de las incidencias de la cartera de TDE, consulte Cartera de TDE y fallos de copia de seguridad.
Cuando se ejecutan los comandos switchover, failover y reinstate, se pueden producir varios mensajes de error. Consulte la documentación de Oracle Database para obtener información sobre estos mensajes de error.
Nota
Oracle recomienda utilizar la interfaz de línea de comandos (dgmgrl) de Data Guard Broker para validar las configuraciones.
-
Como usuario de Oracle, conéctese a la base de datos principal o en espera con
dgmgrl
y verifique la configuración y la base de datos:dgmgrl sys/<pwd>@<database> DGMGRL> VALIDATE CONFIGURATION VERBOSE DGMGRL> VALIDATE DATABASE VERBOSE <PRIMARY> DGMGRL> VALIDATE DATABASE VERBOSE <STANDBY>
- Consulte la documentación de Oracle Database para consultar el mensaje de error respectivo. Por ejemplo:
- ORA-16766: la aplicación de redo está parada.
- ORA-16853: la demora de aplicación ha excedido el umbral especificado.
- ORA-16664: no se ha podido recibir el resultado de un miembro (para la base de datos en espera).
- ORA-12541: TNS: no hay listener (para la base de datos principal).
Para conocer la causa y la solución, revise los errores en Mensajes de error de Database.
Tema principal: Solución de problemas de Oracle Data Guard
Fallos de la aplicación de parches en sistemas Exadata Cloud Infrastructure
Las operaciones de aplicación de parches pueden fallar por diversos motivos. Normalmente, una operación falla porque un nodo de base de datos está caído, no hay suficiente espacio en el sistema de archivos o la máquina virtual no puede acceder al almacén de objetos.
- Determinación del problema
En la consola, puede identificar una operación de aplicación de parches fallida consultando el historial de parches de un sistema Exadata Cloud Infrastructure o una base de datos individual. - Solución de problemas y diagnóstico
Diagnostique las incidencias más comunes que se pueden producir durante el proceso de aplicación de parches de cualquiera de los componentes de Exadata Cloud Infrastructure.
Tema principal: Solución de problemas de sistemas Exadata Cloud Infrastructure
Determinación del problema
En la consola, puede identificar una operación de aplicación de parches con fallos consultando el historial de parches de un sistema Exadata Cloud Infrastructure o una base de datos individual.
Un parche que no se ha aplicado correctamente muestra el estado Failed
(Con fallos) e incluye una breve descripción del error que ha provocado el fallo. Si el mensaje de error no contiene suficiente información para sugerirle una solución, puede usar la CLI y los archivos log de la base de datos para recopilar más datos. A continuación, consulte la sección correspondiente de este tema para encontrar una solución.
Solución de problemas y diagnóstico
Diagnostique las incidencias más comunes que se pueden producir durante el proceso de aplicación de parches de cualquiera de los componentes de Exadata Cloud Infrastructure.
- Incidencias en VM del servidor de base de datos
Una o más de las siguientes condiciones en la VM del servidor de base de datos pueden provocar que fallen las operaciones de aplicación de parches. - Problemas de Oracle Grid Infrastructure
Una o varias de las siguientes condiciones en Oracle Grid Infrastructure pueden provocar fallos en las operaciones de aplicación de parches. - Problemas de las bases de datos de Oracle
Un estado de base de datos incorrecto puede producir fallos en la aplicación de parches.
Incidencias en VM del servidor de base de datos
Una o varias de las siguientes condiciones en la VM del servidor de base de datos pueden provocar fallos en las operaciones de aplicación de parches.
Problemas de conectividad de la VM del servidor de base de datos
Las herramientas en la nube dependen de una configuración de conectividad y de red adecuada entre las máquinas virtuales de un cluster de VM. Si la configuración no está definida correctamente, puede que se produzcan fallos en todas las operaciones que requieren procesamiento entre nodos. Un ejemplo puede ser el no poder descargar los archivos necesarios para aplicar un parche determinado.
En ese caso, puede realizar las siguientes acciones:
- Verifique que la configuración de DNS es correcta de forma que las direcciones de las máquinas virtuales relevantes se puedan resolver en el cluster de VM.
- Consulte los logs de las herramientas en la nube relevantes, como se indica en la sección Obtención de asistencia adicional, y póngase en contacto con los Servicios de Soporte Oracle para obtener más ayuda.
Tema principal: Solución de problemas y diagnóstico
Problemas de Oracle Grid Infrastructure
Una o varias de las siguientes condiciones en Oracle Grid Infrastructure pueden provocar fallos en las operaciones de aplicación de parches.
Oracle Grid Infrastructure está caído
Oracle Clusterware permite a los servidores comunicarse entre sí para que puedan funcionar como una unidad colectiva. El programa de software de cluster debe estar activo y en ejecución en el cluster de VM para que se completen las operaciones de aplicación de parches. En ocasiones, puede que necesite reiniciar Oracle Clusterware para resolver un fallo en la aplicación de parches.
./crsctl check cluster
CRS-4537: Cluster Ready Services is online
CRS-4529: Cluster Synchronization Services is online
CRS-4533: Event Manager is online
crsctl start cluster -all
crsctl check cluster
Tema principal: Solución de problemas y diagnóstico
Incidencias de las bases de datos de Oracle
Un estado de base de datos incorrecto puede producir fallos en la aplicación de parches.
Oracle Database está caído
La base de datos debe estar activa y en ejecución en todos los nodos activos para que las operaciones de aplicación de parches se puedan completar correctamente en todo el cluster.
srvctl status database -d db_unique_name -verbose
El sistema devuelve un mensaje que incluye el estado de la instancia de base de datos. El estado de la instancia debe ser Abierto para que la operación de aplicación de parches se realice correctamente.
srvctl start database -d db_unique_name -o open
Tema principal: Solución de problemas y diagnóstico
Obtención de asistencia adicional
Si no ha podido resolver el problema con la información de este tema, siga los procedimientos siguientes para recopilar la información de diagnóstico y de bases de datos relevante. Una vez recabada la información, póngase en contacto con los Servicios de Soporte Oracle.
- Recopilación de logs de herramientas en la nube
Utilice los archivos log relevantes que podrían ayudar a los Servicios de Soporte Oracle en una investigación más a fondo y la resolución de un problema determinado. - Recopilación de diagnósticos de Oracle
Temas relacionados
Tema principal: Solución de problemas de sistemas Exadata Cloud Infrastructure
Recopilación de logs de herramientas en la nube
Utilice los archivos log relevantes que podrían ayudar a los Servicios de Soporte Oracle en una investigación más a fondo y la resolución de un problema determinado.
Logs de DBAASCLI
/var/opt/oracle/log/dbaascli
dbaascli.log
Tema principal: Obtención de asistencia adicional
Recopilación de diagnósticos de Oracle
Para recopilar los logs y la información de diagnóstico relevantes de Oracle, ejecute el comando dbaascli diag collect
.
Para obtener más información sobre el uso de esta utilidad, consulte Herramientas DBAAS: uso de dbaascli para recopilar registros de herramientas de nube y realizar una comprobación del sistema de las herramientas de nube.
La base de datos en espera no se puede reiniciar tras un switchover en la configuración de Oracle Data Guard en Oracle Database 11g
Descripción: Tras realizar el switchover, la nueva base de datos en espera (la anterior principal) sigue desconectada y no se puede reiniciar.
Acción: Tras realizar el switchover, haga lo siguiente:
- Reinicie la base de datos en espera con el comando
srvctl start database -db <standby dbname>
. - Vuelva a cargar el listener como usuario
grid
en todos los nodos de cluster principales y en espera.- Para volver a cargar el listener con alta disponibilidad, descargue y aplique el parche 25075940 al directorio raíz de Grid. A continuación, ejecute
lsnrctl reload -with_ha
. - Para volver a cargar el listener, ejecute
lsrnctl reload
.
- Para volver a cargar el listener con alta disponibilidad, descargue y aplique el parche 25075940 al directorio raíz de Grid. A continuación, ejecute
Después de volver a cargar el listener, verifique que los servicios <dbname>_DGMGRL
estén cargados en el listener mediante el comando lsnrctl status
.
Para descargar el parche 25075940
- Conéctese a My Oracle Support.
- Haga clic en Parches y actualizaciones.
- Seleccione Número de bug en la lista desplegable Número/Nombre o Número de bug (simple).
- Introduzca el número de bug 34741066 y, a continuación, haga clic en Buscar.
- En los resultados de búsqueda, haga clic en el nombre del último parche.
Se le redirigirá a la página Parche 34741066: LSNRCTL RELOAD -WITH_HA NO HA PODIDO LEER LA ENTRADA ESTÁTICA EN LISTENER.ORA.
- Haga clic en Descargar.
Tema principal: Solución de problemas de sistemas Exadata Cloud Infrastructure
Fallo intermitente en la creación de PDB al crear varias PDB en paralelo
Descripción: la creación de PDB puede fallar para el subjuego de PDB cuando se crean varias PDB en paralelo.
ORA-03113: end-of-file on communication channel
Acción: vuelva a intentar la creación de la PDB fallida.
Tema principal: Solución de problemas de sistemas Exadata Cloud Infrastructure