In diesem Abschnitt wird die Funktionsweise des Fehler-Monitors von Sun Cluster HA für Sun Java System HADB erläutert.
Die Start-Methode der HADB-Ressource startet HADB-Knoten, die für die Ausführung auf dem lokalen Sun Cluster-Knoten konfiguriert sind, falls diese nicht bereits laufen. Daraufhin versucht die Methode, die HADB-Datenbank zu starten. Wenn dieser Versuch fehlschlägt, wird die Datenbank später während des Testsignalvorgangs gestartet.
Das Fehler-Monitor-Testsignal von Sun Cluster HA für Sun Java System HADB testet in periodischen Zeitabständen den Status der HADB-Datenbank und der HADB-Knoten. Das Testsignal startet ausgefallene HADB-Knoten neu und startet auch die HADB-Datenbank, wenn die HADB-Ressource diese während der Start-Methode nicht starten konnte. Bei jedem Durchgang dieses Verfahrens führt das Testsignal folgende Schritte aus:
Zunächst ruht das Testsignal für einen Zeitraum von Thorough_Probe_Interval Sekunden.
Das Testsignal ruft den aktuellen Status der HADB-Datenbank und der HADB-Knoten ab, indem es die Befehle hadbm status und hadbm status --nodes ausführt.
Wenn die Datenbank nicht läuft, prüft das Testsignal, ob die HADB-Datei stopstate für diese Datenbank auf dem lokalen Sun Cluster-Knoten vorhanden ist. Der hadbm start-Befehl verweist beim Start der Datenbank auf die stopstate-Datei für die Rollenzuweisung der Knoten.
Wenn die stopstate-Datei vorhanden ist, wird sie von der HADB-Ressource geprüft, um festzustellen, ob die Datenbank gestartet werden kann.
Wenn die Datenbank gestartet werden kann, startet das Testsignal die Datenbank und setzt den Ressourcenstatus auf Online.
Wenn die Datenbank nicht gestartet werden kann, setzt das Testsignal den Ressourcenstatus auf Online Degraded.
Wenn die Datenbank läuft, startet das Testsignal die HADB-Knoten, die zur Ausführung auf dem lokalen Sun Cluster-Knoten konfiguriert wurden.
Wenn die Datenbank und die lokalen HADB-Knoten laufen, setzt das Testsignal den Ressourcenstatus auf Online, wenn er zuvor Online Degraded war.
Wenn auf allen Sun Cluster-Knoten in der HADB-Ressourcengruppe die HADB-Ressource im Zustand Online Degraded länger als in Stop_timeout angegebene Sekunden läuft, geht die HADB-Ressource davon aus, dass die Datenbank nicht gestartet werden kann.
Wenn die Erweiterungseigenschaft Auto_recovery auf TRUE eingestellt wurde, versucht die HADB-Ressource, die Datenbank wiederherzustellen.
Beim Wiederherstellungsversuch der Datenbank führt das Testsignal folgende Schritte aus:
Der Befehl hadbm clear --fast wird auf einem der Sun Cluster-Knoten in der Knotenliste der Ressourcengruppe ausgegeben. Dieser Befehl löscht den Datenbankinhalt und initialisiert und startet die Datenbank neu.
Wenn der Befehl hadbm clear erfolgreich ausgeführt wurde, wird der in Auto_recovery_command angegebene Befehl auf demselben Sun Cluster-Knoten ausgegeben, der den Befehl hadbm clear ausgegeben hatte. In der Regel handelt es sich bei dem Befehl um ein Skript, das den Befehl asadmin create-session-store enthält. Der Befehl kann auch andere Aktionen ausführen. Er kann zum Beispiel Mails an den Application Server-Verwalter senden.
Wenn beide Schritte erfolgreich ausgeführt wurden, setzt das Testsignal den Zustand der Ressource auf "Online”.
Der Durchlauf wird ab Schritt Eins wiederholt.
Die Parameter Thorough_Probe_Interval und Stop_timeout sind über den scrgadm-Befehl einstellbar. Einzelheiten hierzu finden Sie unter “Standard Properties” in Sun Cluster Data Services Planning and Administration Guide for Solaris OS.