Guide d'administration du systéme de Sun Cluster 2.2

Administration de la base de données de configuration de grappe

La commande ccdadm(1M) permet de gérer la base de données de configuration de grappe (BCG). Pour de plus amples renseignements, consultez la page de manuel ccdadm(1M).


Remarque :

En tant que root (superutilisateur), vous pouvez exécuter la commande ccdadm(1M) à partir de n'importe quel noeud actif. Cette commande met à jour tous les noeuds de la grappe.


Il est conseillé de contrôler point par point la BCG en ajoutant l'option -c (points de contrôle) à la commande ccdadm(1M) après chaque mise à jour de la configuration de grappe. La structure de Sun Cluster fait un usage intensif de la BCG pour stocker les données de configuration liées aux hôtes logiques et aux services de données HD. La BCG sert également à stocker les données de configuration de l'adaptateur réseau utilisées pour la gestion de réseau privé (GRP). Dès que la configuration HD ou GRP de la grappe est modifiée, nous vous suggérons fortement d'archiver un instantané valide de la BCG à jour avec l'option -c à titre d'assurance contre tout problème pouvant résulter d'une défaillance ultérieure. Il n'y pas de raison de se soustraire à une telle pratique sûre. Après tout, même les administrateurs de bases de données ou de systèmes doivent procéder régulièrement à une sauvegarde des données pour se prémunir contre les crises majeures issues de circonstances imprévisibles.

Comment vérifier la cohérence générale de la BCG
  1. Utilisez l'option -v chaque fois que vous suspectez un problème avec la BCG dynamique.

    Cette option permet de comparer l'enregistrement de cohérence de chaque exemplaire de la BCG de tous les noeuds de la grappe pour que vous puissiez vérifier que la base de données demeure cohérente dans l'ensemble des noeuds de la grappe. La fonction d'interrogation de la BCG est désactivée tout au long de la procédure de vérification.


    # ccdadm nom_grappe -v
    

Comment sauvegarder la BCG
  1. Exécutez la commande précédente avec l'option -c une fois par semaine ou lorsque vous faites une sauvegarde de la BCG.

    Cette option crée une copie de sauvegarde de la BCG dynamique. Cette copie peut servir par la suite à récupérer la BCG dynamique avec l'option -r. Voir la "Comment restaurer la BCG" pour de plus amples renseignements à ce sujet.


    Remarque :

    Lorsque vous sauvegardez la BCG, activez le mode de maintenance de tous les hôtes logiques avant d'exécuter la commande ccdadm -c. Pour récupérer la BCG, les hôtes logiques doivent être en mode maintenance. Par conséquent, la présence d'un fichier de sauvegarde identique à l'état restauré de la BCG évite d'exposer inutilement le système aux erreurs ou aux défaillances.



    # ccdadm nom_grappe -c nom_fichier_points_contrôle
    

    Dans cette commande, nom_fichier_points_contrôle est le nom du fichier de sauvegarde.

Comment restaurer la BCG

Exécutez la commande ccdadm(1M) suivie de l'option -r chaque fois que le contenu de la BCG est altéré. Cette option rejette la copie actuelle de la BCG dynamique et restaure cette dernière avec le contenu du fichier de récupération que vous spécifiez. Exécutez cette commande pour initialiser ou restaurer la BCG dynamique lorsque l'algorithme de reconfiguration ccdd(1M) est incapable de choisir une copie valide de la BCG au moment du redémarrage de la grappe. La BCG est alors identifiée comme étant valide.

  1. Désactivez au besoin le quorum.

    Voir la section "Comment activer et désactiver le quorum BCG" pour de plus amples renseignements à ce sujet.


    # ccdadm nom_grappe -q off
    

  2. Activez le mode maintenance des hôtes logiques.


    #  haswitch -m hôtes_logiques
    

  3. Restaurez la BCG.

    Dans la commande suivante, nom_fichier_récupération est le nom du fichier que vous récupérez.


    # ccdadm nom_grappe -r nom_fichier_récupération
    

  4. Si nécessaire, réactivez le quorum BCG.


    # ccdadm nom_grappe -q on
    

  5. Remettez les hôtes logiques en ligne.

    Par exemple :


    # haswitch hôte-physique1 hôte_logique1
    # haswitch hôte-physique2 hôte_logique2
    

Comment activer et désactiver le quorum BCG
  1. Habituellement, le logiciel de grappes requiert un quorum avant de mettre la BCG à jour. L'option -c vous permet de passer outre cette restriction et de mettre la BCG à jour avec n'importe quel nombre de noeuds.

    Utilisez cette option pour activer ou désactiver le quorum au moment de mettre à jour ou de restaurer la BCG dynamique. L'indicateur_quorum est un commutateur à deux valeurs : actif (activation du quorum) et inactif (désactivation du quorum). Par défaut, le quorum est activé.

    Par exemple, si la grappe comporte trois noeuds physiques, vous avez besoin d'au moins deux noeuds pour mettre à jour la BCG. S'il y a eu une défaillance au niveau du matériel, vous ne pouvez réactiver qu'un seul noeud. Le logiciel de grappes ne vous permet donc pas de mettre la BCG à jour. Cependant, si vous exécutez la commande ccdadm -q, vous pouvez désactiver le contrôle logiciel et mettre la BCG à jour.


    # ccdadm nom_grappe -q on|off
    

Comment purifier la BCG
  1. L'option -p vous permet de purifier le fichier de la BCG (c'est-à-dire de vérifier son contenu et la syntaxe utilisée). Utilisez cette option s'il y a des erreurs syntaxiques dans le fichier de la base de données de configuration de grappe.


    # ccdadm -p nom_fichier_BCG
    

    L'option -p signale toute erreur de format dans le fichier ciblé et enregistre une version corrigée dans le fichier nom_fichier.pure. Vous pouvez alors récupérer ce fichier "purifié" en tant que nouvelle BCG. Voir "Comment restaurer la BCG" pour de plus amples renseignements à ce sujet.

Dépannage de la BCG

Le système consigne les erreurs de la BCG dans le fichier /var/opt/SUNWcluster/ccd/ccd.log. Les messages d'erreur critique sont également transmis à la console de grappe. Il est rare que le système subisse une panne majeure, mais dans ce cas, le logiciel crée un fichier noyau dans /var/opt/SUNWcluster/ccd.

Voici un exemple de fichier ccd.log.


lpc204# cat ccd.log 
16 avr 14:54:05 lpc204 ID[SUNWcluster.ccd.ccdd.1005] : (info) démarrage 
de la transition 'START'   avec délai de 10000
16 avr 14:54:05 lpc204 ID[SUNWcluster.ccd.ccdd.1005] : (info) transition 'START' 
  terminée avec état 0
16 avr 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1005] : (info) démarrage 
de la transition 'STEP1' avec délai de 20000
16 avr 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1000] : (info) 
ID_noeud = 0 Actif = 0 No_généré = 0 Date = 
  14 fév 10h30m00 1997 Récupération = 4
16 avr 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1002] : (info) démarrage de la  
reconfiguration de la BCG choisie  à partir de ID_noeud = 0
16 avr 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1004] : 
(info) la BCG d'initialisation est cohérente
16 avr 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1001] : (info) Activation 
du noeud en tant que grappe à un noeud 
  après exécution de scadmin startcluster ; test de quorum BCG omis
16 avr 14:54:06 lpc204 ID[SUNWcluster.ccd.ccdd.1005] : 
(info) transition 'STEP1' terminée avec état 0

Le tableau ci-dessous dresse la liste des messages d'erreur courants et fournit des solutions aux différents problèmes. Le document Sun Cluster 2.2 Error Messages Manual contient la liste exhaustive de ces messages d'erreur.

Tableau 4-1 Messages d'erreur courants de la base de données de configuration de grappe

Numéro de message 

Explication 

Action 

4200 

Impossible d'ouvrir le fichier 

Restaurez la BCG avec la commande ccdadm -r.

4302 

Fichier non trouvé 

Restaurez la BCG avec la commande ccdadm -r.

4307 

BCG d'initialisation incohérente 

Supprimez et réinstallez le logiciel Sun Cluster. 

4402 

Erreur d'inscription du serveur d'appel de procédure à distance (RPC) 

Vérifiez l'état de votre réseau public (problème de réseautage). 

4403 

Echec de création de client RPC 

Vérifiez l'état de votre réseau public (problème de réseautage). 

5000 

Erreur d'exécution système 

Le script de synchronisation comporte une erreur. Vérifiez les permissions relatives au script. 

5300 

BCG non valide, doit être récupérée 

Restaurez la BCG avec la commande ccdadm -r.

5304 

Erreur d'exécution de la commande de prise d'instantané 

Le script de synchronisation exécuté comporte des arguments erronés. Vérifiez la syntaxe du script. 

5306 

Pointeur de grappe nul 

Ce message signale que la grappe n'existe pas (ccdadm grappe). Vérifiez l'exactitude du nom de grappe.