Guide d'administration du systéme de Sun Cluster 2.2

Utilitaires de surveillance

Vous pouvez recourir à l'utilitaire hastat(1M) de Sun Cluster ainsi qu'aux fichiers /var/adm/messages pour surveiller les configurations de Sun Cluster ou encore à l'interface utilisateur graphique de Sun Cluster Manager, qui affiche l'état des principaux composants et sous-composants des grappes. Pour de plus amples renseignements sur Sun Cluster Manager, reportez-vous à la section "Utilisation de Sun Cluster Manager". Sun Cluster fournit également un agent SNMP (Simple Network Management Protocol) qui peut surveiller simultanément jusqu'à 32 grappes. Voir Annexe C.

Si vous utilisez Solstice DiskSuite, vous pouvez également employer les utilitaires metastat(1M), metadb(1M), metatool(1M), medstat(1M) et mdlogd(1M) pour surveiller l'état des ensembles de disques de votre système. Le démon de journalisation SNMP de Solstice DiskSuite, mdlogd(1M), génère une trappe SNMP générique lorsque Solstice DiskSuite consigne un message dans le fichier syslog. Vous pouvez configurer mdlogd(1M) pour qu'il n'envoie une trappe qu'à la consignation de certains messages ; pour ce faire, vous spécifiez une expression régulière dans le fichier de configuration mdlogd.cf(4). La trappe est envoyée à l'hôte d'administration spécifié dans le fichier de configuration. Cet hôte d'administration doit exécuter une application de gestion de réseau comme Solstice SunNet Manager (TM). mdlogd(1M) vous évite d'exécuter la commande metastat(1M) à intervalles réguliers ou d'analyser les données de sortie de syslog pour y retrouver des erreurs ou des avertissements provenant de Solstice DiskSuite. Pour de plus amples renseignements, consultez la page de manuel mdlogd(1M).

Si vous exécutez VxVM, vous pouvez employer les utilitaires vxprint, vxstat, vxtrace, vxnotify et vxva. Pour obtenir des informations au sujet de ces utilitaires, reportez-vous à la documentation sur le logiciel de gestion des volumes.


Remarque :

Pour obtenir des informations sur le dépannage et la réparation des composants défectueux, consultez la documentation fournie.


Surveillance de la configuration avec hastat(1M)

Le programme hastat(1M) affiche l'état courant de la configuration, c'est-à-dire les données sur les hôtes, les hôtes logiques, les réseaux privés et publics, les services de données, les disques locaux et les ensembles de disques, ainsi que les messages d'erreur les plus récents. Le programme hastat(1M) extrait les messages d'erreur liés à Sun Cluster dans le fichier /var/adm/messages et émet les quelques derniers messages de chaque hôte si l'option -m est spécifiée. La liste récente des messages d'erreur étant un extrait filtré des messages de consignation, le contexte de certains messages peut être perdu. Consultez le fichier /var/adm/messages pour obtenir la liste entière des messages. Les pages suivantes présentent un exemple des données de sortie obtenues avec la commande hastat(1M) :


#  hastat -m 10 
ETAT ET CONFIGURATION HAUTE DISPONIBILITE 
-----------------------------------------
LISTE DE LA GRAPPE
      hôte-physique1 est un membre de la grappe
      hôte-physique2 est un membre de la grappe
ETAT DE LA : Stable
TEMPS DE FONCTIONNEMENT DES NOEUDS DE LA GRAPPE
      temps de fonctionnement de hôte-physique1 : StableEtat de la configuration sur hôte-physique2 : 
StableTEMPS DE FONCTIONNEMENT DES NOEUDS DE LA GRAPPE 
temps de fonctionnement de hôte-physique1 : 12:47pm
en fonction depuis 12 jour(s), 21:11,  1 utilisateur, charge moyenne : 0,21, 0,15, 0,14
temps de 
fonctionnement de hôte-physique2 : 12:46pm  en fonction depuis 12 jour(s), 3:15,  3 utilisateurs, charge 
moyenne : 0.40, 0.20, 0.16


HÔTES LOGIQUES MAÎTRISES PAR LES MEMBRES DE LA GRAPPE
Hôtes logiques maîtrisés sur hôte-physique1 : 
      hôte-hd1
Hôtes de l'hôte de consignation pour lesquels hôte-physique1 sert de noeud de relève : 
      hôte-hd2
Hôtes logiques maîtrisés sur hôte-physique2 : 
      hôte-hd2
Hôtes de l'hôte de consignation pour lesquels hôte-physique2 sert de noeud de relève : 
      hôte-hd1
HÔTES LOGIQUES AVEC ETAT MAINTENANCE
    Aucun
ETAT DES RESEAUX PRIVES DE LA GRAPPE
    Etat des interconnexions sur hôte-physique1 : 
      interconnexion0 : sélectionnée
      interconnexion1 : active
    Etat des réseaux privés sur hôte-physique1 : 
      Vers hôte-physique1 - ACTIF
      Vers hôte-physique2 - ACTIF
    Etat des interconnexions sur hôte-physique2 : 
      interconnexion0 : sélectionnée
      interconnexion1 : active
    Etat des réseaux privés sur hôte-physique2 : 
      Vers hôte-physique1 - ACTIF
      Vers hôte-physique2 - ACTIF
ETAT DES RESEAUX PUBLICS DE LA GRAPPE
Etat du réseau public sur hôte-physique1 : 
grp_relève  adaptateur_réel   état  temps_reprise adaptateur_actif
nafo0       le0               OK    JAMAIS        le0
Etat du réseau public sur hôte-physique2 : 
bkggrp  r_adp   status  fo_time live_adp 
nafo0   le0     OK      JAMAIS  le0

ETAT DES SERVICES S'EXECUTANT SUR LES HÔTES LOGIQUES DANS LA GRAPPE 
 Etat des services de données inscrits 
 q :                           Inactif
 p :                          Inactif
 nfs :                        Actif
 oracle :                     Actif
 dns :                        Actif
 nshttp :                     Inactif
 nsldap :                     Actif
Etat des services de données exécutés sur hôte-physique1
Service de données NFS HD : 
Dans l'hôte logique hôte-hd1 : OK
Etat des services de données exécutés sur hôte-physique2
Service de données NFS HD : 
Sur l'hôte logique hôte-hd2 : OK
 Service de données "oracle" : 
 Etat des bases de données sur hôte-physique2 : 
 FICHIERSC22 - en cours d'exécution ; 
Aucune méthode d'état avec le service de données "dns" 
MESSAGES D'ERREUR RECENTS PROVENANT DE LA GRAPPE
Messages d'erreur récents sur hôte-physique1
... 
Messages d'erreur récents sur hôte-physique2
...

Consultation des fichiers de messages

En plus de transmettre les messages à la console, le logiciel Sun Cluster les écrit dans le fichier /var/adm/messages. Voici un exemple de transmission de messages après la défaillance d'un disque.


... 1 juin 16:15:26 hôte1 unix :  
AVERTISSEMENT : /io-unit@f,e1200000/sbi@0.0/SUNW,pln@a0000000,741022/ssd@3,4(ssd49):  
1 juin 16:15:26 hôte1 unix : Erreur de la commande 'write(I))' Err 1 juin 16:15:27 hôte1 
unix : ou Niveau :  
Fatal 1 juin 16:15:27 hôte1 unix : Bloc 144004 demandé, Bloc d'erreur : 715559 1 juin 
16:15:27 hôte1 unix :  
Clé capteur : Erreur de support 1 juin 16:15:27 hôte1 unix : Fournisseur 
'CONNER' :  1 juin 16:15:27 hôte1 unix :  
ASC=0x10(erreur d'ID CRC ou ECC),ASCQ=0x0,FRU=0x15 ...


Remarque :

Les messages d'erreur de Solaris et de Sun Cluster étant stockés dans le fichier /var/adm/messages, le répertoire /var peut se saturer. Reportez-vous à la section "Maintenance du système de fichiers /var" pour corriger ce problème.


Utilitaires de service de données haute disponibilité

Sun Cluster comporte des utilitaires permettant de configurer et de gérer la prestation des services de données à haute disponibilité. Les utilitaires sont décrits dans les pages manuel correspondantes. En voici la liste :