Navigationslinks überspringen | |
Druckansicht beenden | |
![]() |
Oracle Solaris ZFS-Administrationshandbuch Oracle Solaris 10 1/13 Information Library (Deutsch) |
1. Oracle Solaris ZFS-Dateisystem (Einführung)
2. Erste Schritte mit Oracle Solaris ZFS
3. Verwalten von Oracle Solaris ZFS-Speicher-Pools
4. Installieren und Booten eines Oracle Solaris ZFS-Root-Dateisystems
5. Verwalten von Oracle Solaris ZFS-Dateisystemen
6. Arbeiten mit Oracle Solaris ZFS-Schnappschüssen und -Klonen
7. Schützen von Oracle Solaris ZFS-Dateien mit Zugriffskontrolllisten und Attributen
8. Delegierte Oracle Solaris ZFS-Administration
9. Fortgeschrittene Oracle Solaris ZFS-Themen
10. Problembehebung und Pool-Wiederherstellung in Oracle Solaris ZFS
Identifizieren von ZFS-Problemen
Identifizieren von Problemen mit ZFS-Speicherpools
Ermitteln, ob in einem ZFS-Speicher-Pool Probleme vorhanden sind
Überprüfen der Ausgabe des Befehls zpool status
Gesamtinformationen zum Pool-Status
Informationen zur Konfiguration des ZFS-Speicherpools
Bereinigungsstatus des ZFS-Speicherpools
Abhilfe bei Problemen mit ZFS-Speichergeräten
Abhilfe bei fehlendem oder entferntem Gerät
Wiedereinbinden eines Datenspeichergeräts
Benachrichtigung von ZFS nach Wiederherstellung der Verfügbarkeit
Ersetzen oder Reparieren eines beschädigten Geräts
Ermitteln des Gerätefehlertyps
Zurücksetzen vorübergehender Gerätefehler
Austauschen eines Datenspeichergeräts in einem ZFS-Speicher-Pool
Ermitteln, ob ein Gerät ausgetauscht werden kann
Datenspeichergeräte, die nicht ausgetauscht werden können
Austauschen eines Datenspeichergeräts in einem ZFS-Speicher-Pool
Anzeigen des Resilvering-Status
Abhilfe bei Problemen mit ZFS-Dateisystemen
Abhilfe bei Datenproblemen in einem ZFS-Speicherpool
Überprüfen der Integrität des ZFS-Dateisystems
Kontrollieren der ZFS-Datenbereinigung
Explizite ZFS-Datenbereinigung
ZFS-Datenbereinigung und Resilvering
Abhilfe bei ZFS-Speicherplatzproblemen
Speicherplatzprotokollierung bei ZFS-Dateisystem
Speicherplatzprotokollierung bei ZFS-Speicherpool
Ermitteln der Art der Datenbeschädigung
Reparatur beschädigter Dateien bzw. Verzeichnisse
Abhilfe bei beschädigten Daten mit mehreren Blockreferenzen
Reparieren von Schäden am gesamten ZFS-Speicher-Pool
Reparieren einer beschädigten ZFS-Konfiguration
Reparieren eines Systems, das nicht hochgefahren werden kann
11. Empfohlene Oracle Solaris ZFS-Vorgehensweisen
Bestimmen Sie anhand der folgenden Abschnitte, ob Poolprobleme oder die Nichtverfügbarkeit des Dateisystems auf ein Hardwareproblem zurückzuführen sind, wie Fehler bei Hauptplatine, Speicher, Geräten, HBA oder falsche Konfiguration.
Beispiel: Eine ausgefallene oder fehlerhafte Festplatte in einem belegten ZFS-Pool kann die Gesamtsystemleistung stark beeinträchtigen.
Wenn Sie als Erstes Hardwareprobleme diagnostizieren und identifizieren, die einfacher zu erkennen sind, können Sie zur Diagnose der Pool- und Dateisystemprobleme übergehen, wie im weiteren Verlauf dieses Kapitels beschrieben. Wenn die Hardware-, Pool- und Dateisystemkonfigurationen in Ordnung sind, sollten Sie Anwendungsprobleme diagnostizieren, die im Allgemeinen komplexer zu erkennen sind und in diesem Handbuch nicht abgedeckt werden.
Der Solaris Fault Manager überwacht Software-, Hardware- und spezifische Geräteprobleme, indem Fehlertelemetrieinformationen, die auf ein bestimmtes Symptom verweisen, im Fehlerlog identifiziert werden, und indem dann ein Bericht über die tatsächliche Fault-Diagnose erstellt wird, wenn das Fehlersymptom zu einem echten Fault führt.
Mit dem folgenden Befehl werden software- und hardwarebezogene Faults identifiziert.
# fmadm faulty
Verwenden Sie den obigen Befehl routinemäßig, um fehlerhafte Dienste oder Geräte zu identifizieren.
Verwenden Sie den obigen Befehl routinemäßig, um hardware- oder gerätebezogene Fehler zu identifizieren.
# fmdump -eV | more
Fehlermeldungen in dieser Logdatei, die vdev.open_failed-, checksum- oder io_failure-Probleme beschreiben, erfordern ein sofortiges Eingreifen, sonst können sie zu echten Faults werden, die mit dem Befehl fmadm angezeigt werden.
Wenn mit dem obigen Befehl angegeben wird, dass ein Gerät einen Fehler aufweist, muss zu diesem Zeitpunkt geprüft werden, ob ein Ersatzgerät verfügbar ist.
Mit dem Befehl iostat können Sie auch zusätzliche Gerätefehler überwachen. Mit der folgenden Syntax können Sie eine Zusammenfassung der Fehlerstatistiken anzeigen.
# iostat -en ---- errors --- s/w h/w trn tot device 0 0 0 0 c0t5000C500335F95E3d0 0 0 0 0 c0t5000C500335FC3E7d0 0 0 0 0 c0t5000C500335BA8C3d0 0 12 0 12 c2t0d0 0 0 0 0 c0t5000C500335E106Bd0 0 0 0 0 c0t50015179594B6F11d0 0 0 0 0 c0t5000C500335DC60Fd0 0 0 0 0 c0t5000C500335F907Fd0 0 0 0 0 c0t5000C500335BD117d0
Die obige Ausgabe enthält einen Bericht zu Fehlern bei einer internen Festplatte c2t0d0 . Verwenden Sie die folgende Syntax, um detailliertere Gerätefehler anzuzeigen.
# iostat -En c0t5000C500335F95E3d0 Soft Errors: 0 Hard Errors: 0 Transport Errors: 0 Vendor: SEAGATE Product: ST930003SSUN300G Revision: 0B70 Serial No: 110672QFSB Size: 300.00GB <300000000000 bytes> Media Error: 0 Device Not Ready: 0 No Device: 0 Recoverable: 0 Illegal Request: 0 Predictive Failure Analysis: 0 c0t5000C500335FC3E7d0 Soft Errors: 0 Hard Errors: 0 Transport Errors: 0 Vendor: SEAGATE Product: ST930003SSUN300G Revision: 0B70 Serial No: 110672TE67 Size: 300.00GB <300000000000 bytes> Media Error: 0 Device Not Ready: 0 No Device: 0 Recoverable: 0 Illegal Request: 0 Predictive Failure Analysis: 0 c0t5000C500335BA8C3d0 Soft Errors: 0 Hard Errors: 0 Transport Errors: 0 Vendor: SEAGATE Product: ST930003SSUN300G Revision: 0B70 Serial No: 110672SDF4 Size: 300.00GB <300000000000 bytes> Media Error: 0 Device Not Ready: 0 No Device: 0 Recoverable: 0 Illegal Request: 0 Predictive Failure Analysis: 0 c2t0d0 Soft Errors: 0 Hard Errors: 12 Transport Errors: 0 Vendor: AMI Product: Virtual CDROM Revision: 1.00 Serial No: Size: 0.00GB <0 bytes> Media Error: 0 Device Not Ready: 12 No Device: 0 Recoverable: 0 Illegal Request: 2 Predictive Failure Analysis: 0
Neben der kontinuierlichen Verfolgung von Fehlern innerhalb eines Pools zeigt ZFS beim Auftreten bestimmter Ereignisse auch Systemprotokollmeldungen an. In den folgenden Situationen werden Benachrichtigungsereignisse ausgelöst:
Statusübergang eines Datenspeichergeräts – Wenn ein Datenspeichergerät in den Status FAULTED übergeht, protokolliert ZFS eine Meldung, die darauf hinweist, dass die Fehlertoleranz des Pools beeinträchtigt werden könnte. Eine ähnliche Meldung wird gesendet, wenn das Gerät später wieder in Betrieb genommen und die ordnungsgemäße Pool-Funktion wiederhergestellt wird.
Datenbeschädigung – Beim Erkennen von Datenbeschädigungen protokolliert ZFS eine Meldung, die beschreibt, wann und wo die Datenbeschädigung erkannt wurde. Diese Meldung wird nur beim allerersten Auftreten des Ereignisses protokolliert. Ein nachfolgendes Auftreten dieser Ereignisses löst keine Meldung mehr aus.
Pool- und Geräteausfälle – Wenn ein Pool oder Gerät ausfällt, meldet der FehlerAdministrationsdämon diese Fehler mithilfe von Systemprotokollmeldungen und mit dem Befehl fmdump.
Wenn ZFS einen Gerätefehler erkennt und diesen automatisch behebt, wird keine Benachrichtigung gesendet. Solche Fehler stellen keine Einschränkung der Pool-Redundanz bzw. Datenintegrität dar und sind darüber hinaus normalerweise die Folge eines Treiberproblems mit eigenen entsprechenden Fehlermeldungen.