Handbuch Sun Cluster-Datendienst für Sun Java System HADB für das Betriebssystem Solaris

Previous: Warten der HADB-Datenbank

Betrieb des Sun Cluster HA für Sun Java System HADB-Fehler-Monitors

In diesem Abschnitt wird die Funktionsweise des Fehler-Monitors von Sun Cluster HA für Sun Java System HADB erläutert.

Die Start-Methode der HADB-Ressource startet HADB-Knoten, die für die Ausführung auf dem lokalen Sun Cluster-Knoten konfiguriert sind, falls diese nicht bereits laufen. Daraufhin versucht die Methode, die HADB-Datenbank zu starten. Wenn dieser Versuch fehlschlägt, wird die Datenbank später während des Testsignalvorgangs gestartet.

Das Fehler-Monitor-Testsignal von Sun Cluster HA für Sun Java System HADB testet in periodischen Zeitabständen den Status der HADB-Datenbank und der HADB-Knoten. Das Testsignal startet ausgefallene HADB-Knoten neu und startet auch die HADB-Datenbank, wenn die HADB-Ressource diese während der Start-Methode nicht starten konnte. Bei jedem Durchgang dieses Verfahrens führt das Testsignal folgende Schritte aus:

Zunächst ruht das Testsignal für einen Zeitraum von Thorough_Probe_Interval Sekunden.
Das Testsignal ruft den aktuellen Status der HADB-Datenbank und der HADB-Knoten ab, indem es die Befehle hadbm status und hadbm status --nodes ausführt.
Wenn die Datenbank nicht läuft, prüft das Testsignal, ob die HADB-Datei stopstate für diese Datenbank auf dem lokalen Sun Cluster-Knoten vorhanden ist. Der hadbm start-Befehl verweist beim Start der Datenbank auf die stopstate-Datei für die Rollenzuweisung der Knoten.
Wenn die stopstate-Datei vorhanden ist, wird sie von der HADB-Ressource geprüft, um festzustellen, ob die Datenbank gestartet werden kann.
- Wenn die Datenbank gestartet werden kann, startet das Testsignal die Datenbank und setzt den Ressourcenstatus auf Online.
- Wenn die Datenbank nicht gestartet werden kann, setzt das Testsignal den Ressourcenstatus auf Online Degraded.
Wenn die Datenbank läuft, startet das Testsignal die HADB-Knoten, die zur Ausführung auf dem lokalen Sun Cluster-Knoten konfiguriert wurden.
Wenn die Datenbank und die lokalen HADB-Knoten laufen, setzt das Testsignal den Ressourcenstatus auf Online, wenn er zuvor Online Degraded war.
Wenn auf allen Sun Cluster-Knoten in der HADB-Ressourcengruppe die HADB-Ressource im Zustand Online Degraded länger als in Stop_timeout angegebene Sekunden läuft, geht die HADB-Ressource davon aus, dass die Datenbank nicht gestartet werden kann.
Wenn die Erweiterungseigenschaft Auto_recovery auf TRUE eingestellt wurde, versucht die HADB-Ressource, die Datenbank wiederherzustellen.
Beim Wiederherstellungsversuch der Datenbank führt das Testsignal folgende Schritte aus:
- Der Befehl hadbm clear --fast wird auf einem der Sun Cluster-Knoten in der Knotenliste der Ressourcengruppe ausgegeben. Dieser Befehl löscht den Datenbankinhalt und initialisiert und startet die Datenbank neu.
- Wenn der Befehl hadbm clear erfolgreich ausgeführt wurde, wird der in Auto_recovery_command angegebene Befehl auf demselben Sun Cluster-Knoten ausgegeben, der den Befehl hadbm clear ausgegeben hatte. In der Regel handelt es sich bei dem Befehl um ein Skript, das den Befehl asadmin create-session-store enthält. Der Befehl kann auch andere Aktionen ausführen. Er kann zum Beispiel Mails an den Application Server-Verwalter senden.
- Wenn beide Schritte erfolgreich ausgeführt wurden, setzt das Testsignal den Zustand der Ressource auf "Online”.
Der Durchlauf wird ab Schritt Eins wiederholt.

Hinweis –

Die Parameter Thorough_Probe_Interval und Stop_timeout sind über den scrgadm-Befehl einstellbar. Einzelheiten hierzu finden Sie unter “Standard Properties” in Sun Cluster Data Services Planning and Administration Guide for Solaris OS.

Previous: Warten der HADB-Datenbank