Sun Cluster Handbuch Datendienst für Sun Java System Webserver für Solaris OS

Optimieren des Sun Cluster HA für Sun Java System Webserver-Fehlermonitors

Der Sun Cluster HA für Sun Java System Webserver-Fehlermonitor ist in der Ressource enthalten, die Sun Java System Webserver darstellt. Sie erstellen diese Ressourcen, wenn Sie Sun Cluster HA für Sun Java System Webserver registrieren und konfigurieren. Weitere Informationen finden Sie unter Registrieren und Konfigurieren von Sun Cluster HA für Sun Java System Webserver.

Die Systemeigenschaften und Erweiterungseigenschaften dieser Ressource steuern das Verhalten des Fehlermonitors. Die Standardwerte dieser Eigenschaften bestimmen das voreingestellte Verhalten des Fehlermonitors. Das voreingestellte Verhalten sollte für die meisten Sun Cluster-Installationen geeignet sein. Deshalb sollten Sie den Sun Cluster HA für Sun Java System Webserver-Fehlermonitor nur dann optimieren, wenn Sie dieses voreingestellte Verhalten ändern möchten.

Weitere Informationen erhalten Sie in den folgenden Abschnitten.

Operationen vom Fehlermonitor während eines Tests

Das Testsignal-Verfahren für Sun Cluster HA für Sun Java System Webserver fragt den Zustand des Servers mit einer Anfrage ab. Vor der Serverabfrage durch das Testsignal wird eine Prüfung durchgeführt, um zu bestätigen, dass die Netzwerkressourcen für diese Webserverressource konfiguriert sind. Wenn keine Netzwerkressourcen konfiguriert sind, wird eine Fehlermeldung (No network resources found for resource) protokolliert, und das Testsignal-Verfahren wird mit einem Fehler beendet.

Das Testsignal-Verfahren muss die folgenden zwei Konfigurationen von Sun Java System Webserver adressieren:

Wenn sich der Webserver im sicheren Modus befindet und das Testsignal-Verfahren die sicheren Ports aus der Konfigurationsdatei nicht abrufen kann, wird eine Fehlermeldung (Unable to parse configuration file) protokolliert, und das Testsignal-Verfahren wird mit einem Fehler beendet. Das Testsignal-Verfahren für die sichere und unsichere Instanz enthält allgemeine Schritte.

Die Einstellung der Ressourceneigenschaft Network_resources_used für die Sun Java System Webserver-Ressource legt die IP-Adressen für den Webserver fest. Die Einstellung Port_list der Ressource ermittelt die Liste mit Anschlussnummern, die von Sun Java System Webserver verwendet werden. Der Fehler-Monitor geht davon aus, dass der Webserver alle IP-Port-Kombinationen überwacht. Wenn Sie die Webserverkonfiguration zum Überwachen verschiedener Portnummern (zusätzlich zum Port 80) anpassen, müssen Sie sicherstellen, dass die resultierende Konfigurationsdatei (magnus.conf) alle möglichen Kombinationen aus IP-Adressen und Ports enthält. Der Fehler-Monitor testet alle Kombinationen. Möglicherweise tritt ein Fehler auf, wenn der Webserver eine bestimmte Kombination aus IP-Adresse und Port nicht überwacht.

Wenn in dem Test mithilfe einer bestimmten IP-Adresse und Port-Kombination keine Verbindung mit dem Webserver hergestellt werden kann, findet ein kompletter Failure statt. Der Fehler wird aufgezeichnet und die entsprechende Maßnahme wird ergriffen.

Wenn das Testsignal erfolgreich verbunden ist, prüft es, ob der Webserver im sicheren Modus ausgeführt wird. Ist dies der Fall, wird die Verbindung getrennt, und der zurückgegebene Status lautet “rfolg”. Für einen sicheren Sun Java System Webserver werden keine weiteren Prüfungen ausgeführt.

Wenn der Webserver jedoch im unsicheren Modus ausgeführt wird, sendet das Testsignal-Verfahren eine HTTP 1.0 HEAD-Anforderung an den Webserver und wartet auf Antwort. Die Anforderung kann aus verschiedenen Gründen fehlerhaft verlaufen, darunter aufgrund hohen Netzwerkverkehrs, hoher Systemlast und falscher Konfigurationen.

Falsche Konfigurationen sind gegeben, wenn der Webserver nicht zum Überwachen aller Kombinationen aus IP-Adressen und Ports konfiguriert ist, die getestet werden. Der Webserver muss jeden Port für jede IP-Adresse bedienen, die für diese Ressource angegeben ist.

Eine fehlerhafte Konfiguration kann auch darauf zurückzuführen sein, dass die Ressourceneigenschaften Network_resources_used und Port_list beim Erstellen der Ressource nicht ordnungsgemäß angegeben wurden.

Wenn die Antwort auf die Abfrage nicht innerhalb des Zeitgrenzwertes der Ressource Probe_timeout empfangen wird, wird dies als Fehler von Sun Cluster HA für Sun Java System Webserver betrachtet. Der Fehler wird in der Testsignal-History aufgezeichnet.

Ein Testsignal-Fehler kann ein Totalfehlschlag oder ein Teilfehlschlag sein. Folgende Testsignal-Fehler gelten als ganze Totalfehlschläge.

Der Monitor sammelt zwei derartige Teilfehlschläge innerhalb des Intervalls Retry_interval der Ressourceneigenschaft und zählt sie als einen Fehler.

Folgende Testsignal-Fehler werden als Teilfehlschläge betrachtet.

Das Testsignal-Verfahren stellt eine Verbindung mit dem Sun Java System Webserver-Server her und führt eine HTTP 1.1 GET-Überprüfung aus, indem eine HTTP-Anforderung an alle URIs in Monitor_Uri_List gesendet wird. Wenn der Rückgabecode des HTTP-Servers 500 (interner Serverfehler) lautet oder wenn die Verbindung nicht hergestellt werden kann, werden im Rahmen des Testsignal-Verfahrens entsprechende Maßnahmen getroffen.

Das Ergebnis der HTTP-Anfragen ist entweder ein Fehler oder eine erfolgreiche Ausführung. Wenn alle Anfragen eine Antwort vom Server mit Sun Java System Webserver erfolgreich empfangen, wird das Testsignal-Verfahren mit dem nächsten Zyklus aus Testen und Ruhen fortgesetzt.

Hoher Netzwerkverkehr, hohe Systemlasten und fehlerhafte Konfigurationen können zum Fehlschlagen des HTTP GET-Tests führen. Die fehlerhafte Konfiguration der Eigenschaft Monitor_Uri_List kann zu einem Fehler führen, wenn eine URI in Monitor_Uri_List einen falschen Port oder Hostnamen enthält. Wenn die Webserver-Instanz zum Beispiel den logischen Host schost-1 abhört und die URI als http://schost-2/servlet/monitor angegeben wurde, versucht das Testsignal-Verfahren schost-2 zu kontaktieren, um /servlet/monitor anzufordern.

Auf Grundlage des Fehlerverlaufs kann ein Fehler entweder einen lokalen Neustart oder ein Failover des Datendienstes verursachen. Diese Aktion wird im Abschnitt Tuning Fault Monitors for Sun Cluster Data Services in Sun Cluster Data Services Planning and Administration Guide for Solaris OS beschrieben.