Fehlerbehebung bei Oracle Exadata Database Service auf Exascale-Infrastruktursystemen
In diesen Themen werden einige allgemeine Probleme und ihre Behebung behandelt.
- Bekannte Probleme bei Exadata Database Service on Exascale-Infrastruktur
Allgemeine bekannte Probleme. - Fehler bei Oracle Data Guard beheben
Erfahren Sie, wie Sie Probleme bei Oracle Data Guard ermitteln und beheben können. - Weitere Unterstützung
Übergeordnetes Thema: Referenzleitfäden für Oracle Exadata Database Service auf Exascale-Infrastruktur
Bekannte Probleme bei Exadata Database Service auf Exascale-Infrastruktur
Allgemeine bekannte Probleme.
Übergeordnetes Thema: Fehlerbehebung bei Oracle Exadata Database Service auf Exascale-Infrastruktursystemen
Fehler bei Oracle Data Guard beheben
Erfahren Sie, wie Sie Probleme bei Oracle Data Guard ermitteln und beheben können.
Bei der Fehlerbehebung bei Oracle Data Guard müssen Sie zuerst bestimmen, ob das Problem beim Setup und der Initialisierung von Data Guard oder bei der Verwendung von Data Guard auftritt, wenn Lebenszyklusbefehle eingegeben werden. Die Schritte zum Ermitteln und Beheben der Probleme unterscheiden sich je nach Szenario, in dem sie verwendet werden.
Es gibt drei Lebenszyklusvorgänge: Switchover, Failover und Neuinstanziierung. Für alle diese Befehle wird der Data Guard-Broker verwendet. Die Broker-Befehlszeilenschnittstelle (dgmgrl
) ist das wichtigste Tool zur Ermittlung und Behebung der Probleme. Obwohl Sie die Ursachen anhand der Logdateien ermitteln können, gestalten sich Prüfung und Ermittlung von Problemen mit dgmgrl
in der Regel schneller und einfacher.
Das Einrichten und Aktivieren von Data Guard umfasst mehrere Schritte. Für jeden Schritt werden Logdateien erstellt. Wenn einer der Schritte nicht erfolgreich ausgeführt werden kann, prüfen Sie die entsprechende Logdatei, um das Problem zu ermitteln und zu beheben.
- Primäres Cloud-VM-Cluster und Primärdatenbank validieren
- Standby-Cloud-VM-Cluster validieren
- Dateien neu erstellen und in die Standbydatenbank kopieren (Kennwortdatei und Wallets)
- Data Guard über das Netzwerk erstellen (RMAN-Befehl "Duplizieren")
- Data Guard-Broker konfigurieren
- Setup abschließen
- Fehler bei Data Guard mit Logdateien beheben
Die Tools zur Ermittlung des Problems und die Speicherorte der relevanten Logdateien unterscheiden sich je nach Szenario, in dem sie verwendet werden. - Fehler beim Data Guard-Setup-Prozess beheben
Prüfen Sie Fehler, die bei den verschiedenen Schritten des Data Guard-Setup-Prozesses auftreten können. Während einige Fehler in der Konsole angezeigt werden, sind die meisten Ursachen in den Logdateien zu finden.
Übergeordnetes Thema: Fehlerbehebung bei Oracle Exadata Database Service auf Exascale-Infrastruktursystemen
Fehler bei Data Guard mit Logdateien beheben
Die Tools zur Ermittlung des Problems und die Speicherorte der relevanten Logdateien unterscheiden sich je nach Szenario, in dem sie verwendet werden.
Verwenden Sie die folgenden Prozeduren, um relevante Logdateien zu sammeln und Probleme zu untersuchen. Wenn Sie das Problem nach der Untersuchung der Logdateien nicht beheben können, wenden Sie sich an My Oracle Support.
Fassen Sie die gesammelten Dateien zur Vorbereitung für Oracle Support in einem komprimierten Archiv zusammen, z.B. einer ZIP-Datei.
Erfassen Sie auf jedem mit der Data Guard-Konfiguration verknüpften Compute Node Logdateien, die sich auf das aufgetretene Problem beziehen.
- Logdateien der Aktivierungsphase (z.B. solche zur Dokumentation des Vorgangs " Standbydatenbank erstellen") und die Logs für das entsprechende Primär- oder Standbysystem.
- Logdateien der Aktivierungsjob-ID. Beispiel: 23.
- Speicherort der Logdateien nach Aktivierungsphase und Exadata-System (Primär oder Standby).
- Logdateien für Datenbanknamen (
db_name
oderdb_unique_name
, je nach Dateipfad).
Prüfen Sie alle Knoten der entsprechenden Exadata-Primär- und Standbysysteme. Auf einem System ausgeführte Befehle können auf einem beliebigen Knoten ausgeführt worden sein.
Data Guard Deployer (DGdeployer
) ist der Prozess, der die Konfiguration ausführt. Bei der Konfiguration der Primärdatenbank wird die Datei /var/opt/oracle/log/<dbname>/dgdeployer/dgdeployer.log
erstellt.
Dieses Log sollte die Ursache eines Fehlers bei der Konfiguration der Primärdatenbank enthalten.
- Die primäre Logdatei des Befehlszeilenutilitys
dbaasapi
ist:/var/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log
. Suchen Sie nach Einträgen, diedg_api
enthalten. - Eine Standbylogdatei des Befehlszeilenutilitys
dbaasapi
ist:/var/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log
. Suchen Sie in diesem Log nach Einträgen, diedg_api
enthalten. - Die andere Standbylogdatei ist:
/var/opt/oracle/log/<dbname>/dgcc/dgcc.log
. Dies ist das Data Guard-Konfigurationslog.
- Die Oracle Cloud Deployment Engine (ODCE) erstellt die Datei
/var/opt/oracle/log/<dbname>/ocde/ocde.log
. Dieses Log sollte die Ursache für einen Fehler beim Erstellen der Standbydatenbank enthalten. - Das Befehlszeilenutility
dbaasapi
erstellt die Dateivar/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log
. Suchen Sie nach Einträgen, diedg_api
enthalten. - Die Data Guard-Konfigurationslogdatei ist
/var/opt/oracle/log/<dbname>/dgcc/dgcc.log
.
DGdeployer
ist der Prozess, der die Konfiguration ausführt. Er erstellt die folgende Datei:/var/opt/oracle/log/<dbname>/dgdeployer/dgdeployer.log
. Dieses Log sollte die Ursache eines Fehlers bei der Konfiguration der Standbydatenbank enthalten.- Das Befehlszeilenutility
dbaasapi
erstellt die Dateivar/opt/oracle/log/dbaasapi/db/dg/<job_ID>.log
. Suchen Sie nach Einträgen, diedg_api
enthalten. - Das Data Guard-Konfigurationslog ist
/var/opt/oracle/log/<dbname>/dgcc/dgcc.log
.
DGdeployer
ist der Prozess, der die Konfiguration ausführt. Bei der Konfiguration von Data Guard wird die Datei /var/opt/oracle/log/<dbname>/dgdeployer/dgdeployer.log
erstellt. Dieses Log sollte die Ursache eines Fehlers bei der Konfiguration der Primärdatenbank enthalten.
Erfassen Sie auf jedem Knoten der Primär- und Standbysites Logdateien für den zugehörigen Datenbanknamen (db_name
).
Prüfen Sie alle Knoten in Exadata-Primär- und Standbysystemen. Ein Lifecycle-Management-Vorgang kann sich sowohl auf Primär- als auch auf Standbysysteme auswirken.
- Datenbankalertlog:
/u02/app/oracle/diag/rdbms/<dbname>/<dbinstance>/trace/alert_<dbinstance>.log
- Data Guard-Brokerlog:
/u02/app/oracle/diag/rdbms/<dbname>/<dbinstance>/trace/drc<dbinstance>.log
- Cloud-Tooling-Logdatei für Data Guard:
/var/opt/oracle/log/<dbname>/odg/odg.log
Übergeordnetes Thema: Fehler bei Oracle Data Guard beheben
Fehler beim Data Guard-Setupprozess beheben
Prüfen Sie die Fehler, die bei den verschiedenen Schritten des Data Guard-Setupprozesses auftreten können. Während einige Fehler in der Konsole angezeigt werden, sind die meisten Ursachen in den Logdateien zu finden.
Das zum Aktivieren von Data Guard eingegebene Kennwort stimmte nicht mit dem primären Admin-Kennwort für den SYS-Benutzer überein. Dieser Fehler tritt während der Aktivierungsphase "Primärdatenbank validieren" auf.
Die Datenbank wird möglicherweise nicht ausgeführt. Dieser Fehler tritt während der Aktivierungsphase "Primärdatenbank validieren" auf. Prüfen Sie mit srvctl
und sql
auf dem Host, ob die Datenbank auf allen Knoten hochgefahren und gestartet ist.
Die Primärdatenbank konnte nicht konfiguriert werden. Dieser Fehler kann durch ungültige Data Guard-Befehle oder eine nicht erfolgreiche Listener-Neukonfiguration verursacht werden.
Das TDE- Wallet konnte nicht erstellt werden. Die Oracle TDE-Keystore-(Wallet-)Dateien konnten nicht für den Transport zur Standbysite vorbereitet werden. Dieser Fehler tritt während der Aktivierungsphase "TDE-Wallet erstellen" auf. Eines der folgenden Elemente kann zu einem Fehler in dieser Phase führen:
- Auf die TDE-Wallet-Dateien konnte nicht zugegriffen werden
- Die Aktivierungsbefehle konnten kein Archiv mit den Wallet-Dateien erstellen
Prozedur bei der Fehlersuche:
- Stellen Sie sicher, dass auf das Cluster zugegriffen werden kann. Um den Status eines Clusters zu prüfen, führen Sie den folgenden Befehl aus:
crsctl check cluster -all
- Wenn das Cluster heruntergefahren ist, führen Sie den folgenden Befehl aus, um es neu zu starten:
crsctl start crs -wait
- Wenn dieser Fehler auftritt, obwohl auf das Cluster zugegriffen werden kann, prüfen Sie die Logs für die Aktivierungsphase "TDE-Wallet erstellen", um Ursache und Lösung für den Fehler zu bestimmen.
Das Archiv mit dem TDE-Wallet wurde wahrscheinlich nicht an die Standbysite übertragen. Das Problem kann in der Regel durch Wiederholen behoben werden.
- Primär- und Standbysite können möglicherweise nicht miteinander kommunizieren, um die Standbydatenbank zu konfigurieren. Diese Fehler treten während der Aktivierungsphase "Standbydatenbank konfigurieren" auf. In dieser Phase werden Konfigurationen an der Standbydatenbank vorgenommen, einschließlich des RMAN-Duplikats der Primärdatenbank. So beheben Sie dieses Problem:
- Prüfen Sie den Konnektivitätsstatus für Primär- und Standbysite.
- Stellen Sie sicher, dass der Host über Port 1521 mit allen Ports kommunizieren kann. Prüfen Sie das Netzwerksetup, einschließlich Netzwerksicherheitsgruppen (NSGs), Netzwerksicherheitslisten und gegebenenfalls das Remote-VCN-Peering-Setup. Die beste Möglichkeit zum Testen der Kommunikation zwischen Host und anderen Knoten besteht darin, über SQL*Plus von der Primär- auf die Standbydatenbank und von der Standby- auf die Primärdatenbank zuzugreifen.
- Die SCAN-VIPs oder Listener werden möglicherweise nicht ausgeführt. Verwenden Sie den obigen Test, um das Problem zu ermitteln.
Mögliche Ursachen:
- Die SCAN-VIPs oder Listener werden möglicherweise nicht ausgeführt. Sie können das Vorliegen dieses Problems mit den folgenden Befehlen auf einem beliebigen Clusterknoten bestätigen.
-
[grid@exa1-****** ~]$ srvctl status scan
-
[grid@exa1-****** ~]$ srvctl status scan_listener
-
- Die Datenbanken sind möglicherweise nicht erreichbar. Sie können das Vorliegen dieses Problems bestätigen, indem Sie versuchen, mit einem vorhandenen Oracle Net-Alias eine Verbindung herzustellen.
Prozedur bei der Fehlersuche:
- Prüfen Sie als BS-Benutzer "oracle", ob ein Oracle Net-Alias für die Containerdatenbank (CDB) vorhanden ist. Suchen Sie nach einem Alias in der Datei $ORACLE_HOME/network/admin/<dbname>/tnsnames.ora.
Das folgende Beispiel zeigt einen Eintrag für eine Containerdatenbank namens db12c:
cat $ORACLE_HOME/network/admin/db12c/tnsnames.ora DB12C = (DESCRIPTION =(ADDRESS = (PROTOCOL = TCP)(HOST = exa1-*****-scan.********.******.******.com)(PORT = 1521)) (CONNECT_DATA = (SERVER = DEDICATED) (SERVICE_NAME = db12c.********.******.******.com) (FAILOVER_MODE = (TYPE = select) (METHOD = basic))))
- Prüfen Sie, ob Sie mit dem Alias eine Verbindung zu der Datenbank herstellen können. Beispiel: Geben Sie als "sysdba" den folgenden Befehl ein:
sqlplus sys@db12c
Mögliche Ursache: Die Kennwörter der Oracle Database-Benutzer "sys" oder "system" für die Datenbank und das TDE-Wallet sind möglicherweise nicht identisch. So vergleichen Sie die Kennwörter:
- Stellen Sie als Benutzer sys eine Verbindung zu der Datenbank her, und prüfen Sie den TDE-Status in
.V$ENCRYPTION_WALLET
- Stellen Sie als Benutzer system eine Verbindung zu der Datenbank her, und prüfen Sie den TDE-Status in
.V$ENCRYPTION_WALLET
- Aktualisieren Sie die entsprechenden Kennwörter so, dass sie übereinstimmen. Melden Sie sich als Benutzer opc beim Systemhost an, und führen Sie die folgenden Befehle aus:
- So ändern Sie das SYS-Kennwort:
sudo dbaascli database changepassword --dbname <database_name>
- So ändern Sie das TDE- Wallet-Kennwort:
sudo dbaascli tde changepassword --dbname <database_name>
- So ändern Sie das SYS-Kennwort:
Wenn die Befehle für Switchover, Failover und Neuinstanziierung ausgeführt werden, können mehrere Fehlermeldungen auftreten. Diese Fehlermeldungen finden Sie in der Oracle Database-Dokumentation.
Notiz
Oracle empfiehlt die Verwendung der Data Guard-Broker-Befehlszeilenschnittstelle (dgmgrl), um die Konfigurationen zu validieren.
-
Stellen Sie als Oracle-Benutzer mit
dgmgrl
eine Verbindung zur Primär- oder Standbydatenbank her, und prüfen Sie die Konfiguration und die Datenbank:dgmgrl sys/<pwd>@<database> DGMGRL> VALIDATE CONFIGURATION VERBOSE DGMGRL> VALIDATE DATABASE VERBOSE <PRIMARY> DGMGRL> VALIDATE DATABASE VERBOSE <STANDBY>
- Schlagen Sie die entsprechende Fehlermeldung in der Oracle Database-Dokumentation nach. Beispiel:
- ORA-16766: Redo Apply ist gestoppt.
- ORA-16853: Apply Lag hat den angegebenen Schwellenwert überschritten.
- ORA-16664: Ergebnis kann nicht von einem Member empfangen werden (Standbydatenbank).
- ORA-12541: TNS: Kein Listener (Primärdatenbank)
Übergeordnetes Thema: Fehler bei Oracle Data Guard beheben
Weitere Unterstützung
Wenn Sie das Problem anhand der Informationen in diesem Thema nicht lösen können, gehen Sie wie folgt vor, um relevante Datenbank- und Diagnoseinformationen zu sammeln. Nachdem Sie diese Informationen erfasst haben, wenden Sie sich an Oracle Support.
- Cloud-Tooling-Logs erfassen
Verwenden Sie die relevanten Logdateien, die Oracle Support bei der weiteren Untersuchung und Lösung eines gegebenen Problems unterstützen können. - Oracle Diagnostics erfassen
Verwandte Themen
Übergeordnetes Thema: Fehlerbehebung bei Oracle Exadata Database Service auf Exascale-Infrastruktursystemen
Cloud-Tooling-Logs erfassen
Verwenden Sie die relevanten Logdateien, die Oracle Support bei der weiteren Untersuchung und Behebung eines gegebenen Problems unterstützen könnten.
DBAASCLI-Logs
/var/opt/oracle/log/dbaascli
dbaascli.log
Übergeordnetes Thema: Weitere Unterstützung
Oracle Diagnostics erfassen
Um die relevanten Oracle-Diagnoseinformationen und -logs zu erfassen, führen Sie den Befehl dbaascli diag collect
aus.
Weitere Informationen zur Verwendung dieses Utilitys finden Sie unter DBAAS-Tooling: Mit dbaascli Cloud-Tooling-Logs erfassen und Cloud-Tooling-Health Check durchführen.
Verwandte Themen
Übergeordnetes Thema: Weitere Unterstützung