Handbuch Sun Cluster-Datendienst für Sun Java System HADB für das Betriebssystem Solaris

Betrieb des Sun Cluster HA für Sun Java System HADB-Fehler-Monitors

In diesem Abschnitt wird die Funktionsweise des Fehler-Monitors von Sun Cluster HA für Sun Java System HADB erläutert.

Die Start-Methode der HADB-Ressource startet HADB-Knoten, die für die Ausführung auf dem lokalen Sun Cluster-Knoten konfiguriert sind, falls diese nicht bereits laufen. Daraufhin versucht die Methode, die HADB-Datenbank zu starten. Wenn dieser Versuch fehlschlägt, wird die Datenbank später während des Testsignalvorgangs gestartet.

Das Fehler-Monitor-Testsignal von Sun Cluster HA für Sun Java System HADB testet in periodischen Zeitabständen den Status der HADB-Datenbank und der HADB-Knoten. Das Testsignal startet ausgefallene HADB-Knoten neu und startet auch die HADB-Datenbank, wenn die HADB-Ressource diese während der Start-Methode nicht starten konnte. Bei jedem Durchgang dieses Verfahrens führt das Testsignal folgende Schritte aus:

  1. Zunächst ruht das Testsignal für einen Zeitraum von Thorough_Probe_Interval Sekunden.

  2. Das Testsignal ruft den aktuellen Status der HADB-Datenbank und der HADB-Knoten ab, indem es die Befehle hadbm status und hadbm status --nodes ausführt.

  3. Wenn die Datenbank nicht läuft, prüft das Testsignal, ob die HADB-Datei stopstate für diese Datenbank auf dem lokalen Sun Cluster-Knoten vorhanden ist. Der hadbm start-Befehl verweist beim Start der Datenbank auf die stopstate-Datei für die Rollenzuweisung der Knoten.

  4. Wenn die stopstate-Datei vorhanden ist, wird sie von der HADB-Ressource geprüft, um festzustellen, ob die Datenbank gestartet werden kann.

    • Wenn die Datenbank gestartet werden kann, startet das Testsignal die Datenbank und setzt den Ressourcenstatus auf Online.

    • Wenn die Datenbank nicht gestartet werden kann, setzt das Testsignal den Ressourcenstatus auf Online Degraded.

  5. Wenn die Datenbank läuft, startet das Testsignal die HADB-Knoten, die zur Ausführung auf dem lokalen Sun Cluster-Knoten konfiguriert wurden.

  6. Wenn die Datenbank und die lokalen HADB-Knoten laufen, setzt das Testsignal den Ressourcenstatus auf Online, wenn er zuvor Online Degraded war.

  7. Wenn auf allen Sun Cluster-Knoten in der HADB-Ressourcengruppe die HADB-Ressource im Zustand Online Degraded länger als in Stop_timeout angegebene Sekunden läuft, geht die HADB-Ressource davon aus, dass die Datenbank nicht gestartet werden kann.

  8. Wenn die Erweiterungseigenschaft Auto_recovery auf TRUE eingestellt wurde, versucht die HADB-Ressource, die Datenbank wiederherzustellen.

  9. Beim Wiederherstellungsversuch der Datenbank führt das Testsignal folgende Schritte aus:

    • Der Befehl hadbm clear --fast wird auf einem der Sun Cluster-Knoten in der Knotenliste der Ressourcengruppe ausgegeben. Dieser Befehl löscht den Datenbankinhalt und initialisiert und startet die Datenbank neu.

    • Wenn der Befehl hadbm clear erfolgreich ausgeführt wurde, wird der in Auto_recovery_command angegebene Befehl auf demselben Sun Cluster-Knoten ausgegeben, der den Befehl hadbm clear ausgegeben hatte. In der Regel handelt es sich bei dem Befehl um ein Skript, das den Befehl asadmin create-session-store enthält. Der Befehl kann auch andere Aktionen ausführen. Er kann zum Beispiel Mails an den Application Server-Verwalter senden.

    • Wenn beide Schritte erfolgreich ausgeführt wurden, setzt das Testsignal den Zustand der Ressource auf "Online”.

  10. Der Durchlauf wird ab Schritt Eins wiederholt.


Hinweis –

Die Parameter Thorough_Probe_Interval und Stop_timeout sind über den scrgadm-Befehl einstellbar. Einzelheiten hierzu finden Sie unter “Standard Properties” in Sun Cluster Data Services Planning and Administration Guide for Solaris OS.