Sun Cluster Handbuch Datendienst für Sun Java System Application Server EE (HADB) für Solaris OS

Optimieren des Fehler-Monitors für Sun Cluster HA für Sun Java System Application Server EE (HADB)

Der Fehler-Monitor für Sun Cluster HA für Sun Java System Application Server EE (HADB) ist in der Ressource enthalten, die Sun Java System Application Server EE (HADB) darstellt. Sie erstellen diese Ressource, wenn Sie Sun Cluster HA für Sun Java System Application Server EE (HADB) registrieren und konfigurieren. Weitere Informationen finden Sie unter Registrieren und Konfigurieren von Sun Cluster HA für Sun Java System Application Server EE (HADB).

Die Systemeigenschaften und Erweiterungseigenschaften dieser Ressource steuern das Verhalten des Fehler-Monitors. Die Standardwerte dieser Eigenschaften bestimmen das voreingestellte Verhalten des Fehler-Monitors. Das voreingestellte Verhalten sollte für die meisten Sun Cluster-Installationen geeignet sein. Deshalb sollten Sie den Fehler-Monitor nur dann optimieren, wenn Sie dieses voreingestellte Verhalten ändern möchten.

Weitere Informationen erhalten Sie in den folgenden Abschnitten.

Operationen vom Fehler-Monitor während eines Tests

Die Start-Methode der HADB-Ressource startet HADB-Knoten, die für die Ausführung auf dem lokalen Sun Cluster-Knoten konfiguriert sind, falls diese nicht bereits laufen. Die Methode unternimmt dann den Versuch, die HADB-Datenbank zu starten. Wenn ein Fehler auftritt, wird die Datenbank zu einem späteren Zeitpunkt des Tests gestartet.

Der Fehler-Monitor-Test prüft den Status der HADB-Datenbank und der HADB-Knoten in regelmäßigen Abständen. Der Test startet die fehlgeschlagenen HADB-Knoten neu. Der Test startet auch die HADB-Datenbank, wenn die HADB-Ressource die Datenbank nicht während der Startmethode aufrufen kann. Bei jedem Durchgang dieses Verfahrens führt das Testsignal folgende Schritte aus:

  1. Es ruft den aktuellen Status der HADB-Datenbank und der HADB-Knoten durch Ausführen der Befehle hadbm status und hadbm status --nodes ab.

  2. Wenn die Datenbank nicht ausgeführt wird, prüft das Testsignal, ob die HADB-Datei stopstate, die dieser Datenbank entspricht, auf dem lokalen Sun Cluster-Knoten vorhanden ist. Der Befehl hadbm start verweist auf die Datei stopstate mit der Rollenzuweisung von Knoten, wenn die Datenbank gestartet wird.

  3. Wenn die stopstate-Datei vorhanden ist, wird sie von der HADB-Ressource geprüft, um festzustellen, ob die Datenbank gestartet werden kann.

    • Wenn die Datenbank gestartet werden kann, startet das Testsignal die Datenbank und setzt den Ressourcenstatus auf Online.

    • Wenn die Datenbank nicht gestartet werden kann, setzt das Testsignal den Ressourcenstatus auf Online Degraded.

  4. Wenn die Datenbank läuft, startet das Testsignal die HADB-Knoten, die zur Ausführung auf dem lokalen Sun Cluster-Knoten konfiguriert wurden.

  5. Wenn die Datenbank und die lokalen HADB-Knoten ausgeführt werden, setzt das Testsignal den Status auf Online, falls er zuvor Online Degraded lautete.

  6. Wenn auf allen Sun Cluster-Knoten in der HADB-Ressourcengruppe die HADB-Ressource im Status Online Degraded länger als die unter Stop_timeout angegebene Anzahl Sekunden ausgeführt wird, schließt die HADB-Ressource daraus, dass die Datenbank nicht gestartet werden kann. Eine Beschreibung der Stop_timeout-Eigenschaft finden Sie unter der Ressourceneigenschaft Methode_timeout in Anhang A, Standard Properties in Sun Cluster Data Services Planning and Administration Guide for Solaris OS.

  7. Wenn die Erweiterungseigenschaft Auto_recovery auf TRUE gesetzt ist, versucht die HADB-Ressource, die Datenbank wiederherzustellen.

  8. Beim Wiederherstellungsversuch der Datenbank führt das Testsignal folgende Schritte aus:

    • Es führt den Befehl hadbm clear --fast auf einem der Sun Cluster-Knoten aus der Knotenliste der Ressourcengruppe aus. Dieser Befehl löscht den Datenbankinhalt und initialisiert und startet die Datenbank neu.

    • Wenn der Befehl hadbm clear erfolgreich ausgeführt wurde, wird der in Auto_recovery_command angegebene Befehl auf demselben Sun Cluster-Knoten ausgegeben, der den Befehl hadbm clear ausgegeben hatte. In der Regel handelt es sich bei dem Befehl um ein Skript, das den Befehl asadmin create-session-store enthält. Der Befehl kann auch andere Aktionen ausführen. Zum Beispiel könnte er eine E-Mail an den Application Server-Administrator senden.

    • Wenn beide Schritte erfolgreich ausgeführt wurden, setzt das Testsignal den Status der Ressource auf Online.