Risoluzione dei problemi dei sistemi Oracle Exadata Database Service on Cloud@Customer

Questi argomenti trattano alcuni problemi comuni che potresti incontrare e come affrontarli.

Errori di applicazione delle patch nei sistemi Oracle Exadata Database Service on Cloud@Customer

Le operazioni di applicazione delle patch possono non riuscire per vari motivi. In genere, un'operazione non riesce perché un nodo di database è inattivo, lo spazio disponibile nel file system è insufficiente oppure la virtual machine non è in grado di accedere all'area di memorizzazione degli oggetti.

Determinazione del problema

Nella console è possibile identificare un'operazione di applicazione delle patch non riuscita visualizzando la cronologia delle patch di un sistema Oracle Exadata Database Service on Cloud@Customer o di un singolo database.

Una patch non applicata correttamente visualizza lo stato Failed e include una breve descrizione dell'errore che ha causato l'errore. Se il messaggio di errore non contiene informazioni sufficienti per indirizzare l'utente a una soluzione, è possibile utilizzare l'interfaccia CLI del database e i file di log per raccogliere più dati. Quindi, fare riferimento alla sezione applicabile in questo argomento per una soluzione.

Risoluzione dei problemi e diagnosi

Individua i problemi più comuni che possono verificarsi durante il processo di applicazione delle patch di qualsiasi componente di Oracle Exadata Database Service on Cloud@Customer.

Problemi VM del database server

Una o più delle seguenti condizioni nella VM del database server possono causare l'errore delle operazioni di applicazione delle patch.

Problemi di connettività VM del database server

Gli strumenti cloud si basano sulla configurazione di rete e connettività corretta tra le virtual machine di un determinato cluster VM. Se la configurazione non è impostata correttamente, si potrebbero verificare errori in tutte le operazioni che richiedono l'elaborazione cross-node. Un esempio potrebbe non essere possibile scaricare i file richiesti per applicare una determinata patch.

In base al caso, è possibile eseguire le azioni riportate di seguito.

  • Verificare che la configurazione DNS sia corretta in modo che gli indirizzi delle virtual machine pertinenti siano risolvibili all'interno del cluster VM.
  • Consultare i log pertinenti di Cloud Tooling come indicato nella sezione Ottenere ulteriore assistenza e contattare il Supporto Oracle per ulteriore assistenza.
Problemi di Oracle Grid Infrastructure

Una o più delle seguenti condizioni in Oracle Grid Infrastructure possono impedire l'esecuzione delle operazioni di applicazione delle patch.

Oracle Grid Infrastructure è inattivo

Oracle Clusterware consente ai server di comunicare tra loro in modo da poter funzionare come unità collettiva. Per completare le operazioni di applicazione delle patch, è necessario che il programma software del cluster sia attivo e in esecuzione nel cluster VM. A volte potrebbe essere necessario riavviare Oracle Clusterware per risolvere un errore di applicazione delle patch.

In questi casi, verificare lo stato di Oracle Grid Infrastructure come indicato di seguito.
./crsctl check cluster
CRS-4537: Cluster Ready Services is online
CRS-4529: Cluster Synchronization Services is online
CRS-4533: Event Manager is online
Se Oracle Grid Infrastructure è inattivo, riavviare eseguendo i comandi riportati di seguito.
crsctl start cluster -all
crsctl check cluster
Problemi dei database Oracle

Uno stato del database non corretto può causare errori di applicazione delle patch.

Oracle Database non disponibile

Il database deve essere attivo e in esecuzione su tutti i nodi attivi in modo da poter completare correttamente le operazioni di applicazione delle patch nel cluster.

Utilizzare il seguente comando per controllare lo stato del database e assicurarsi che vengano risolti eventuali problemi che potrebbero aver messo il database in uno stato non corretto:
srvctl status database -d db_unique_name -verbose

Il sistema restituisce un messaggio che include lo stato dell'istanza di database. Affinché l'operazione di applicazione delle patch riesca, lo stato dell'istanza deve essere Apri.

Se il database non è in esecuzione, utilizzare il seguente comando per avviarlo:
srvctl start database -d db_unique_name -o open

Ottenere ulteriore assistenza

Se non si è riusciti a risolvere il problema utilizzando le informazioni riportate in questo argomento, attenersi alle procedure riportate di seguito per raccogliere le informazioni relative al database e alla diagnostica. Dopo aver raccolto queste informazioni, contattare il Supporto Oracle.

Argomenti correlati

Raccolta dei log di Cloud Tooling

Utilizzare i file di log pertinenti che potrebbero aiutare il Supporto Oracle a ulteriori indagini e a risolvere un determinato problema.

Log DBAASCLI

/var/opt/oracle/log/dbaascli
  • dbaascli.log

Raccolta di Oracle Diagnostics

Per raccogliere le informazioni e i log di diagnostica Oracle pertinenti, eseguire il comando dbaascli diag collect.

Per ulteriori informazioni sull'uso di questa utility, vedere DBAAS Tooling: Using dbaascli to Collect Cloud Tooling Logs and Perform a Cloud Tooling Health Check.

Interruzioni dell'aggiornamento del sistema operativo VM durante l'eliminazione della connessione al database

Descrizione: si tratta di un problema intermittente. Durante l'aggiornamento del sistema operativo della macchina virtuale con Grid Infrastructure 19c e i database IN esecuzione, dbnodeupdate.sh attende che RHPhelper scarichi le connessioni, che non progrediranno a causa di un bug noto "DBNODEUPDATE.SH HANGS IN RHPHELPER TO DRAIN SESSIONS AND SHUTDOWN INSTANCE".

Sintomi: esistono due possibili cause per questo bug:
  1. L'aggiornamento del sistema operativo VM si blocca in rhphelper
    • Appende l'automazione
    • Alcune o nessuna delle connessioni al database sarà stata eliminata e alcune o tutte le istanze di database rimarranno in esecuzione.
  2. L'aggiornamento del sistema operativo VM non elimina le connessioni al database perché si è verificato un arresto anomalo di rhphelper
    • Non blocca l'automazione
    • Completamento di alcuni o nessuno dei processi di drenaggio della connessione al database

/var/log/cellos/dbnodeupdate.trc mostrerà come ultima riga:

(ACTION:) Executing RHPhelper to drain sessions and shutdown instances. 
(trace:/u01/app/grid/crsdata/scaqak04dv0201/rhp//executeRHPDrain.150721125206.trc)
Azione:
  1. Aggiornare Grid Infrastructure alla versione 19.11 o successiva.

    (OR)

    Disabilitare rhphelper prima di aggiornarlo e riabilitarlo dopo l'aggiornamento.

    Per disabilitare prima di avviare l'aggiornamento, effettuare le operazioni riportate di seguito.
    /u01/app/19.0.0.0/grid/srvm/admin/rhphelper /u01/app/19.0.0.0/grid 19.10.0.0.0 -setDrainAttributes ENABLE=false
    Per abilitare dopo il completamento dell'aggiornamento:
    /u01/app/19.0.0.0/grid/srvm/admin/rhphelper /u01/app/19.0.0.0/grid oracle-home-current-version -setDrainAttributes ENABLE=true

    Se si disabilita rhphelper, la connessione al database non verrà svuotata prima che i servizi e le istanze del database vengano chiusi in un nodo prima dell'aggiornamento del sistema operativo.

  2. Se si è persa la disabilitazione di RHPhelper e l'aggiornamento non è in corso e sospeso, si osserva che la rimozione dei servizi richiede tempo:
    1. Controllare il file di trace /var/log/cellos/dbnodeupdate.trc, che contiene un paragrafo simile al seguente:
      (ACTION:) Executing RHPhelper to drain sessions and shutdown instances. 
      (trace: /u01/app/grid/crsdata/<nodename>/rhp//executeRHPDrain.150721125206.trc)
    2. Aprire il file di trace /var/log/cellos/dbnodeupdate.trc.
      Se rhphelper non riesce, il file di trace contiene il messaggio seguente:
      "Failed execution of RHPhelper"
      Se rhphelper viene sospeso, il file di trace contiene il messaggio come indicato di seguito.
      (ACTION:) Executing RHPhelper to drain sessions and shutdown instances.
    3. Identificare i processi rhphelper in esecuzione a livello di sistema operativo e arrestarli.

      Ci sono due comandi che avranno la stringa "rhphelper" nel nome - una shell Bash, e il programma Java sottostante, che è in realtà rhphelper in esecuzione.

      rhphelper viene eseguito come root, pertanto deve essere eliminato come root (sudo da opc).

      Ad esempio:
      [opc@<HOST> ~] pgrep –lf rhphelper
      191032 rhphelper
      191038 java
      
      [opc@<HOST> ~] sudo kill –KILL 191032 191038
    4. Verificare che il file dbnodeupdate.trc venga spostato e che lo stack Grid Infrastructure sul nodo sia chiuso.

    Per ulteriori informazioni su RHPhelper, vedere Utilizzo di RHPhelper per ridurre al minimo il tempo di inattività durante la manutenzione pianificata in Exadata (ID documento 2385790.1).

Non è possibile aggiungere una VM a un cluster VM

Descrizione: quando si aggiunge una VM a un cluster VM, è possibile che si verifichi il seguente problema:
[FATAL] [INS-32156] Installer has detected that there are non-readable files in oracle home.
CAUSE: Following files are non-readable, due to insufficient permission oracle.ahf/data/scaqak03dv0104/diag/tfa/tfactl/user_root/tfa_client.trc
ACTION: Ensure the above files are readable by grid.

Causa: l'Installer ha rilevato un file di trace non leggibile, oracle.ahf/data/scaqak03dv0104/diag/tfa/tfactl/user_root/tfa_client.trc creato da Autonomous Health Framework (AHF) nella Oracle home che causa l'errore di aggiunta di una VM cluster.

AHF eseguito come root ha creato un file trc con proprietà root, che l'utente grid non è in grado di leggere.

Azione: prima di aggiungere VM a un cluster VM, assicurarsi che i file di trace AHF siano leggibili dall'utente grid. Per risolvere il problema dell'autorizzazione, eseguire i comandi seguenti come root su tutte le VM cluster VM esistenti:
chown grid:oinstall /u01/app/19.0.0.0/grid/srvm/admin/logging.properties
chown -R grid:oinstall /u01/app/19.0.0.0/grid/oracle.ahf*
chown -R grid:oinstall /u01/app/grid/oracle.ahf*

Lista di nodi non aggiornata per i database abilitati per Data Guard

Descrizione: l'aggiunta di una VM a un cluster VM è stata completata. Tuttavia, per i database abilitati per Data Guard, la nuova VM non viene aggiunta alla lista di nodi nel file /var/opt/oracle/creg/<db>.ini.

Causa: i database abilitati per Data Guard non verranno estesi alla nuova VM aggiunta. Pertanto, anche il file <db>.ini non verrà aggiornato perché l'istanza di database non è configurata nella nuova VM.

Azione: per aggiungere un'istanza ai database primari e in standby e alle nuove VM (Non-Data Guard) e per rimuovere un'istanza da un ambiente Data Guard, vedere la nota di My Oracle Support 2811352.1.

Ridimensionamento non in linea CPU non riuscito

Descrizione: il ridimensionamento non in linea della CPU non riesce con il seguente errore:
** CPU Scale Update **An error occurred during module execution. Please refer to the log file for more information

Causa: dopo il provisioning di un cluster VM, il file /var/opt/oracle/cprops/cprops.ini generato automaticamente dal database as a service (DBaaS) non viene aggiornato con i parametri common_dcs_agent_bindHost e common_dcs_agent_port e pertanto la scalabilità non in linea della CPU non riesce.

Azione: come utente root, aggiungere manualmente le seguenti voci nel file /var/opt/oracle/cprops/cprops.ini.
common_dcs_agent_bindHost=<IP_Address>
common_dcs_agent_port=7070
Nota

Il valore common_dcs_agent_port è sempre 7070.
Eseguire il comando seguente per ottenere l'indirizzo IP:
netstat -tunlp | grep 7070
Ad esempio:
netstat -tunlp | grep 7070
tcp 0 0 <IP address 1>:7070 0.0.0.0:* LISTEN 42092/java
tcp 0 0 <IP address 2>:7070 0.0.0.0:* LISTEN 42092/java

È possibile specificare uno dei due indirizzi IP, <IP address 1> o <IP address 2>, per il parametro common_dcs_agent_bindHost.

Impossibile riavviare il database in standby dopo lo switchover nell'impostazione di Oracle Data Guard di Oracle Database 11g

Descrizione: dopo l'esecuzione dello switchover, il nuovo database di standby (vecchio database primario) rimane chiuso e non viene riavviato.

Azione: dopo aver eseguito lo switchover, effettuare le operazioni riportate di seguito.

  1. Riavviare il database di standby utilizzando il comando srvctl start database -db <standby dbname>.
  2. Ricaricare il listener come utente grid su tutti i nodi del cluster primario e in standby.
    • Per ricaricare il listener utilizzando High Availability, scaricare e applicare la patch 25075940 alla home Grid, quindi eseguire lsnrctl reload -with_ha.
    • Per ricaricare il listener, eseguire lsrnctl reload.

Dopo aver ricaricato il listener, verificare che i servizi <dbname>_DGMGRL vengano caricati nel listener utilizzando il comando lsnrctl status.

Per scaricare la patch 25075940

  1. Accedere a My Oracle Support.
  2. Fare clic su Patch e aggiornamenti.
  3. Selezionare Numero bug dall'elenco a discesa Nome/numero o numero bug (semplice).
  4. Immettere il numero di bug 34741066, quindi fare clic su Cerca.
  5. Fare clic sul nome della patch più recente nei risultati della ricerca.

    Si verrà reindirizzati alla pagina Patch 34741066: LSNRCTL RELOAD -WITH_HA FAILED TO READ THE STATIC ENTRY IN LISTENER.ORA.

  6. Fare clic su Scarica.

L'uso della porta listener SCAN personalizzata con Data Guard su rete di disaster recovery causa errori di verifica dell'associazione Data Guard

Descrizione: se la porta del listener SCAN per la rete client e la rete di recupero da errori irreversibili (rete DR) sono diverse, la configurazione Data Guard (DG) non riesce durante la fase di verifica della creazione dell'associazione Data Guard.

Azione: utilizzare le stesse porte del listener SCAN (o porta predefinita) su tutte le reti. Per correggere la porta del listener dopo la configurazione del cluster, eseguire il comando GI home/bin/srvctl modify listener -listener listener_name -endpoints endpoints. Per ulteriori informazioni, vedere srvctl modify listener nel manuale Oracle Real Application Clusters Administration and Deployment Guide.

Creazione PDB non riuscita dopo lo spostamento del database in una nuova home DB (23ai)

Descrizione: dopo aver riposizionato un database in una home DB diversa, la creazione di un nuovo pluggable database (PDB) non riesce. Avvio del servizio PDB non riuscito. Si è verificato il seguente errore:
[FATAL] [DBAAS-60022] Command '/u02/app/oracle/product/23.0.0.0/dbhome_3/bin/srvctl 'start' 'service' '-db' 'db23ano' '-service' 'db23ano_PDBJULY242.paas.oracle.com'' has failed on nodes [localnode].

Azione: se la versione di Grid Infrastructure è la 23.4.0.24.05, eseguire l'upgrade alla versione 23.5.0.24.07 per risolvere il problema.

Errore intermittente nella creazione del PDB quando più PDB vengono creati in parallelo

Descrizione: la creazione del PDB potrebbe non riuscire per il subset di PDB quando vengono creati più PDB in parallelo.

Causa: la creazione del PDB potrebbe notare l'errore seguente in modo intermittente.
ORA-03113: end-of-file on communication channel

Azione: riprovare la creazione del PDB non riuscita.