Guide d'administration du systéme de Sun Cluster 2.2

Aperçu de la gestion de réseau public

Le service PNM de Sun Clustera recours à la surveillance des défaillances et à la reprise pour empêcher la perte de disponibilité des noeuds provoquée par une seule panne d'adaptateur réseau ou de câble. Le service PNM effectue la surveillance des défaillances au niveau du noeud local ou dans la grappe toute entière et vérifie l'état des noeuds, des adaptateurs réseau, des câbles et du trafic sur le réseau. La fonction de reprise du service PNM utilise des ensembles d'adaptateurs réseau, appelés groupes de sauvegarde, pour assurer la redondance des connexions entre un noeud de grappe et le réseau public. La surveillance des défaillances et la reprise travaillent de concert pour garantir la disponibilité des services.

Vous devez activer le service PNM si votre système est configuré avec des services de données HD ; ces services de données dépendent de la surveillance des défaillances par le service PNM. Lorsqu'un service de données HD éprouve un problème de disponibilité, il interroge le service PNM par l'intermédiaire de la structure de la grappe pour savoir si le problème est lié aux connexions du réseau public. Si tel est le cas, les services de données attendent que le service de gestion PNM ait résolu le problème. Si le réseau public n'est pas à l'origine du problème, les services de données font appel à leur propre mécanisme de reprise.

Le module de gestion PNM, SUNWpnm, est installé lors de la première installation du logiciel Sun Cluster. Les commandes associées au service PNM sont :

Pour de plus amples renseignements, consultez les pages de manuel pertinentes.

Surveillance des défaillances et reprise par le service PNM

Le service PNM surveille l'état du réseau public et des adaptateurs réseau associés à chaque noeud de la grappe et signale les cas suspects ou les erreurs. Lorsqu'il détecte l'absence de réponse d'un adaptateur réseau principal (celui par qui transitent les données en provenance ou à destination du noeud), le service PNM commute le service de réseau de ce noeud vers un adaptateur réseau en état de marche dans le groupe de sauvegarde. Il effectue ensuite certaines vérifications pour déterminer si l'adaptateur réseau ou le réseau lui-même est à l'origine de la défaillance.

Si l'adaptateur est défectueux, le service PNM envoie des messages d'erreur au fichier syslog(3) ; le gestionnaire de grappe détecte à son tour ces messages et les affiche par l'intermédiaire d'une IUG. Une fois réparé, l'adaptateur est testé puis réintégré dans le groupe de sauvegarde lors de la prochaine reconfiguration de la grappe. Si c'est le groupe d'adaptateurs réseau de sauvegarde tout entier qui tombe en panne, la structure Sun Cluster commande une reprise du noeud pour maintenir la disponibilité. Si une erreur se produit mais qu'elle dépasse le cadre de contrôle du service PNM, par exemple lorsqu'un sous-réseau entier tombe en panne, la reprise et la reconfiguration s'effectuent normalement.

Le service PNM fonctionne en deux modes de surveillance : gestion de grappe active et gestion de grappe inactive. Il est en mode de gestion de grappe active lorsque la grappe est fonctionnelle. Dans ce cas, il utilise la base de données de configuration de grappe (BCG) pour surveiller l'état du réseau (pour de plus amples renseignements sur la BCG, consultez le chapitre d'aperçu du Sun Cluster 2.2 Software Installation Guide). Le service PNM utilise la BCG pour faire la distinction entre une panne de réseau public et une panne d'adaptateur réseau local. Voir Annexe B pour obtenir d'autres informations sur la reprise des hôtes logiques provoqué par une défaillance du réseau public.

Le service PNM passe en mode de gestion de grappe inactive lorsque la grappe n'est pas fonctionnelle. Dans ce mode, il ne peut se servir de la BCG et est donc incapable de faire la distinction entre une panne d'adaptateur réseau et une défaillance du réseau lui-même. En mode de gestion de grappe inactive, le service PNM ne détecte que les problèmes au niveau de la connexion au réseau local.

Le service PNM comporte une commande de surveillance, pnmstat(1M), vous permettant de vérifier l'état du réseau public et des adaptateurs réseau. Pour de plus amples renseignements, consultez la page de manuel pertinente.

Groupes de sauvegarde

Les groupes de sauvegarde sont des ensembles d'adaptateurs réseau assurant la redondance des connexions entre un noeud de grappe unique et le réseau public. La commande scinstall(1M) permet de configurer ces groupes de sauvegarde lors de l'installation initiale ; par la suite, vous devez utiliser la commande pnmset(1M). Le service PNM vous permet de configurer autant d'adaptateurs réseau redondants que vous le voulez dans un seul hôte.

Pour configurer les groupes de sauvegarde la première fois, exécutez la commande pnmset(1M) en tant que root (superutilisateur) avant de démarrer la grappe. La commande fonctionne comme un script interactif permettant de configurer les groupes de sauvegarde et d'en vérifier l'état. Elle sélectionne également un adaptateur réseau qui servira d'adaptateur principal ou actif. La commande pnmset(1M) attribue un nom aux groupes de sauvegarde nafon, où n est un nombre entier que vous assignez vous-même. Cette commande enregistre les informations sur les différents groupes de sauvegarde dans le fichier /etc/pnmconfig.

Pour modifier une configuration existante du service PNM sur un noeud de grappe, vous devez supprimer le noeud de la grappe et exécuter ensuite la commande pnmset(1M). Le service PNM assure la surveillance des modifications apportées à l'appartenance au groupe de sauvegarde et les intègre à ce dernier de façon dynamique.


Remarque :

Le fichier /etc/pnmconfig n'est pas supprimé même si on désinstalle le module SUNWpnm, par exemple, pour mettre un élément logiciel du système à niveau. Autrement dit, les informations sur l'appartenance au groupe de sauvegarde sont conservées pendant les mises à niveau des logiciels, et vous n'avez pas à exécuter de nouveau l'utilitaire pnmset(1M), à moins que vous ne vouliez modifier l'appartenance au groupe de sauvegarde.


Mises à jour du fichier nsswitch.conf

Au moment de configurer le service PNM avec un adaptateur réseau de sauvegarde, le fichier /etc/nsswitch.conf doit comporter une des entrées suivantes relatives à l'entrée masques_réseau.

Tableau 6-1 Choix de services de nom pour le fichier /etc/nsswitch.conf File

Service de nom utilisé 

Entrée masques_réseau

aucun 

masques_réseau : files

nis

masques_réseau : fichiers [INTROUVABLE=entrée] nis

nisplus

masques_réseau : fichiers [INTROUVABLE=entrée] nisplus

Les paramètres précédents bloquent la consultation du paramètre masques_réseau dans une table de recherche NIS/NIS+. Ce blocage est essentiel si l'adaptateur défectueux est le réseau public principal et qu'il ne peut fournir les informations demandées. Si le réglage de l'entrée masques_réseau précédent est incorrect, la reprise vers l'adaptateur de sauvegarde échoue.


Attention : Attention :

Les modifications apportées précédemment ont pour effet d'utiliser les fichiers locaux (/etc/masques_réseau et /etc/groupes) en tant que tables de recherche. Les services NIS/NIS+ ne peuvent servir que lorsque les fichiers locaux ne sont pas disponibles. Par conséquent, il faut constamment mettre à jour ces fichiers avec leurs versions NIS/NIS+. S'ils ne sont pas mis à jour, les noeuds de grappe ne peuvent accéder aux valeurs attendues qu'ils contiennent.