Guide des services de données Sun Cluster 3.1 pour Sun ONE Application Server

Appréhension du détecteur de pannes de Sun Cluster HA pour Sun ONE Application Server

 

Les informations présentées dans cette rubrique permettent de comprendre le détecteur de pannes de Sun Cluster HA pour Sun ONE Application Server.

Vous y trouverez les informations suivantes :

Propriétés d'extension

Le détecteur de pannes de Sun Cluster HA pour Sun ONE Application Server utilise les propriétés d'extension présentées ci-après. Vous pouvez éventuellement les régler.

Tableau 1–3 Propriétés d'extension de Sun Cluster HA pour Sun ONE Application Server

Nom/Type de données 

Description  

Confdir_list(tableau de chaînes)

Le chemin complet du répertoire de configuration de Sun ONE Application Server est défini dans cette propriété d'extension.  

Valeur par défaut : aucune

Réglable : à la création

Liste_Uri_détecteur (chaîne)

URI seul ou liste d'URI pouvant être utilisés par le détecteur de pannes pour tester la fonctionnalité de Sun ONE Application Server. Le détecteur de pannes teste le serveur d'application en exécutant un HTTP GET sur l'URI. Liste_Uri_détecteur peut être utilisée pour sonder la fonctionnalité des applications déployées. Sondez-les en définissant la propriété sur un ou plusieurs URI gérés par des applications déployées sur Sun ONE Application Server. Si le code de retour du serveur HTTP est 500 (erreur interne du serveur) ou si la connexion échoue, la sonde entre en action. Reportez-vous aux méthodes de sonde pour de plus amples détails.

Valeur par défaut : nul

Réglable : à tout moment

 

Analyse d'algorithmes et de fonctionnalités

La sonde Sun Cluster HA pour Sun ONE Application Server envoie une requête au serveur au sujet de l'état de Sun ONE Application Server. Elle exécute la procédure suivante :

  1. Elle sonde l'instance de Sun ONE Application Server en fonction du délai d'attente défini dans la propriété de ressource Délai_sonde.

  2. Elle se connecte aux combinaisons adresse IP/port définies par la configuration des ressources réseau et le paramètre liste_ports du groupe de ressources. Si la ressource est configurée sans liste_ports vide, cette étape est sautée. Si la connexion réussit, la sonde se déconnecte. Dans le cas contraire, l'échec est enregistré.

    La requête peut échouer en raison d'un trafic réseau intense, d'une charge système importante ou d'une configuration erronée. Cette dernière situation peut survenir si vous n'avez pas configuré le serveur Sun ONE Application Server pour qu'il écoute sur toutes les combinaisons adresse IP/port sondées. Sun ONE Application Server doit servir chaque port de chaque adresse IP spécifiée pour la ressource.

  3. Elle se connecte à Sun ONE Application Server et exécute un contrôle HTTP 1.1 GET en envoyant une requête HTTP et en recevant une réponse pour tous les URI de Liste_Uri_détecteur.

    Le résultat des requêtes HTTP est soit un échec, soit une réussite. Si toutes les requêtes ont bien reçu une réponse de Sun ONE Application Server, la sonde revient et poursuit le cycle d'analyse et de veille suivant.

    La sonde HTTP GET peut échouer en raison d'un trafic réseau intense, d'une charge système importante ou d'une configuration erronée. Une configuration erronée de la propriété Liste_Uri_détecteur peut provoquer une panne si un URI de cette liste contient un port ou un nom d'hôte incorrect. Par exemple, si l'instance du serveur d'application écoute sur l'hôte logique schost-1 et que l'URI a été spécifiée comme http://schost-2/servlet/monitor, la sonde tente de contacter schost-2 pour solliciter /servlet/monitor.

  4. Elle enregistre un échec dans le journal de l'historique si la réponse à la sonde n'arrive pas dans le délai imparti par délai_sonde. La sonde considère cette situation comme un échec de la part du service de données de Sun ONE Application Server. Un échec de la sonde de Sun ONE Application Server peut être total ou partiel.

    Si la réponse à la sonde arrive dans le délai imparti par délai_sonde , le code de réponse HTTP fait l'objet d'un contrôle. Si le code de réponse est 500 "erreur interne du serveur", l'analyse de la sonde est considérée comme un échec total. Tous les autres codes de réponse sont ignorés.

    Vous trouverez ci-dessous des échecs d'analyse totaux.

    • Le message d'erreur suivant est émis en cas d'échec de connexion au serveur. %s correspond au nom d'hôte, et %d au numéro de port.


      Échec de connexion à l'hôte <%s> et au port <%d>. Réception d'un code de réponse de 500 "Erreur interne du serveur" Le code de réponse d'HTTP GET pour l'analyse de %s est 500. Basculement en cours d'exécution.

    • Le message d'erreur suivant est émis en cas d'échec de l'envoi de la chaîne d'analyse au serveur. Le premier %s correspond au nom d'hôte, %d au numéro de port, et le second %s fournit de plus amples détails sur l'erreur.


      Échec d'écriture sur le serveur : serveur %s port %d : %s.

  5. Le détecteur accumule les échecs partiels survenant dans la définition de la propriété de ressource Intervalle_nouvelles_tentatives jusqu'à ce qu'ils équivalent à un échec total.

    Vous trouverez ci-dessous des échecs d'analyse partiels.

    • Le message d'erreur suivant est émis lorsque la déconnexion échoue avant l'écoulement du délai d'attente Délai_sonde. Le premier %d correspond au numéro de port et %s au nom de la ressource.


      Échec de déconnexion du port %d de la ressource %s.

    • L'impossibilité d'exécuter toutes les étapes d'analyse dans le délai imparti dans Délai_sonde constitue un échec partiel.

    • Le message d'erreur suivant est émis lors d'un échec de lecture des données du serveur pour d'autres raisons. Le premier %s correspond au nom d'hôte, et %d au numéro de port. Le second %s fournit plus de détails sur l'erreur.


      Échec de communication avec le port %d du serveur %s : %s

  6. Basée sur l'historique des pannes, une défaillance peut entraîner un redémarrage local ou une panne du service de données.