Pour mettre un noeud dans n'importe quel mode à l'exception du mode multi-utilisateurs, ou pour arrêter ou réinitialiser un noeud, vous devez arrêter le moniteur d'appartenance de Sun Cluster. Utilisez alors la méthode d'administration préférée de votre site pour assurer la maintenance subséquente du noeud.
Pour arrêter la grappe, vous devez arrêter également le moniteur d'appartenance sur tous les noeuds de la grappe. Pour ce faire, exécutez simultanément la commande scadmin stopnode sur tous les noeuds.
Vous ne pouvez arrêter le moniteur d'appartenance que lorsque le noeud local Sun Cluster ne possède aucun hôte logique.
Pour arrêter la moniteur d'appartenance sur un noeud, commutez le ou les hôtes logiques vers un autre noeud avec la commande haswitch(1M), puis exécutez la commande suivante :
phys-hahost1# haswitch hôte_destinationhôte_logique phys-hahost1# scadmin stopnode |
Si le noeud possède un hôte logique lorsque la commande scadmin stopnode est exécutée, il en perd la propriété au profit d'un autre noeud en mesure de maîtriser cet hôte avant l'arrêt du moniteur d'appartenance. Si le maître de relève de l'hôte logique est inactif, la commande scadmin stopnode interrompt les services de données en plus d'arrêter le moniteur d'appartenance.
Une fois la commande scadmin stopnode exécutée, Sun Cluster demeure arrêté jusqu'à l'exécution de la commande scadmin startnode, même après plusieurs réinitialisations du système.
La commande scadmin stopnode retire le noeud de la grappe. Si aucune autre défaillance ne se produit simultanément, vous pouvez arrêter autant de noeuds que vous le désirez, sans perdre le quorum au niveau des noeuds restants. (L'absence de quorum provoque l'arrêt de toute la grappe.)
Si vous arrêtez un noeud pour réparer un disque, vous devez également préparer le disque d'initialisation ou de données en suivant les procédures relatives aux disques d'initialisation du Chapitre 10, ou celles qui portent sur les disques de données dans la documentation fournie avec votre gestionnaire de volumes.
Vous devrez peut-être arrêter un ou plusieurs noeuds de Sun Cluster pour procéder à la maintenance matérielle, comme l'ajout ou la suppression de cartes SBus. Les sections suivantes décrivent la procédure requise pour arrêter un seul noeud ou la grappe en entier.
Dans une grappe comportant deux noeuds ou davantage et un système de stockage directement connecté, un problème peut se produire si le dernier noeud de la grappe subit une erreur grave ou quitte la grappe de façon inhabituelle (sans exécuter la transition stopnode). Dans un tel cas, tous les noeuds sont retirés de la grappe et celle-ci n'existe plus, mais comme le dernier noeud s'est retiré de manière inhabituelle, il tient toujours le verrouillage de noeud. Lors d'un appel ultérieur de la commande scadmin startcluster, celle-ci ne pourra obtenir le verrouillage de noeud. Pour résoudre ce problème, effacez manuellement le verrouillage de noeud avant de redémarrer la grappe, à l'aide de la procédure "Comment supprimer un verrouillage de noeud après une erreur grave de grappe".
S'il n'est pas nécessaire que les données demeurent disponibles, placez les hôtes logiques (groupes de disques) en mode de maintenance.
phys-hahost2# haswitch -m hôte_logique |
Pour de plus amples renseignements, consultez la page de manuel haswitch(1M).
L'arrêt d'un noeud Sun Cluster peut être obtenu avec la commande halt(1M) ; il s'ensuit une récupération des services de l'hôte logique sur le noeud de relève. Cependant, le résultat de la commande halt(1M) peut créer une confusion au niveau du noeud. L'exécution de la commande haswitch(1M) constitue une méthode de commutation de la propriété des hôtes logiques plus fiable.
Arrêtez Sun Cluster sur un noeud sans arrêter les services en cours d'exécution sur les autres noeuds de la grappe.
phys-hahost1# scadmin stopnode |
Lorsque vous arrêtez un noeud, le message d'erreur suivant peut s'afficher : in.rdiscd[517] : setsockopt (IP_DROP_MEMBERSHIP) : Impossible d'attribuer l'adresse demandée. Cette erreur est due à un problème de synchronisation entre le démon in.rdiscd et le module IP. Elle est sans gravité et peut être ignorée.
Arrêtez le noeud.
phys-hahost1# halt |
Le noeud peut maintenant être réparé.
L'arrêt de tous les noeuds d'une configuration Sun Cluster peut s'avérer nécessaire lorsque l'environnement présente des conditions dangereuses comme une panne du système de refroidissement ou un orage violent.
Arrêtez simultanément le moniteur d'appartenance sur tous les noeuds avec la commande scadmin(1M).
Exécutez cette commande sur la console de chaque noeud de la grappe. Laissez chaque noeud quitter la grappe et attendez que les noeuds restants se soient reconfigurés complètement avant d'exécuter la commande sur le noeud suivant
phys-hahost1# scadmin stopnode ... |
Arrêtez tous les noeuds avec la commande halt(1M).
phys-hahost1# halt ... |
Arrêtez un noeud Sun Cluster quelconque avec la commande halt(1M) ou uadmin(1M).
Si le moniteur d'appartenance est en cours d'exécution à l'arrêt d'un noeud, il y a de fortes chances que ce dernier provoque un "dépassement du délai imparti". Le message suivant apparaît alors :
panic[cpu9]/thread=0x50f939e0 : Dépassement du délai imparti - unité |
Une telle situation peut être évitée en arrêtant le moniteur d'appartenance avant le noeud. Pour de plus amples renseignements à ce sujet, voyez la procédure "Comment arrêter Sun Cluster sur tous les noeuds".
Dans une grappe comportant deux noeuds ou davantage et un système de stockage directement connecté, un problème peut se produire si le dernier noeud de la grappe subit une erreur grave ou quitte la grappe de façon inhabituelle (sans exécuter la transition stopnode). Dans un tel cas, tous les noeuds sont retirés de la grappe et celle-ci n'existe plus, mais comme le dernier noeud s'est retiré de manière inhabituelle, il tient toujours le verrouillage de noeud. Lors d'un appel ultérieur de la commande scadmin startcluster, celle-ci ne pourra obtenir le verrouillage de noeud.
Pour contourner ce problème, effacez manuellement le verrouillage de noeud avant de redémarrer la grappe. Utilisez la procédure suivante pour effacer manuellement le verrouillage de noeud et redémarrer la grappe, après fin anormale de celle-ci.
En tant que root (superutilisateur), affichez la configuration de la grappe.
# scconf nom_grappe -p |
Repérez cette ligne dans la sortie :
nom_grappe Locking TC/SSP, port : A.B.C.D, E |
Dans le cas d'un verrouillage de noeud sur un concentrateur de terminaux (CT), procédez comme suit.
Etablissez une connexion telnet au concentrateur de terminaux nom-tc.
$ telnet nom_ct Essai de 192.9.75.51... Connecté à nom_ct. Le caractère d'échappement est `^]'. |
Appuyez sur Entrée pour continuer.
Précisez cli (interface de ligne de commande).
Entrez le nom de port ou le numéro d'Annexe : cli |
Connectez-vous comme root (superutilisateur).
Exécutez la commande admin.
annex# admin |
Réinitialisez le port E.
admin : reset E |
Mettez fin à la connexion telnet.
annex# hangup |
Passez à Étape 4.
Dans le cas d'un verrouillage de noeud sur un processeur de services système (PSS), suivez les étapes ci-dessous.
Connectez-vous au PSS.
$ telnet nom_pss |
Ouvrez une session en tant qu'utilisateur pss.
Affichez les informations concernant le fichier nom_grappe.lock à l'aide de la commande suivante. (Ce fichier est un lien symbolique à /proc/csh.pid.)
$ ls -l /var/tmp/nom_grappe.lock |
Recherchez le processus csh.pid.
$ ps -ef | grep csh.pid |
Si le processus csh.pid figure dans le résultat ps -ef, interrompez ce processus à l'aide de la commande suivante.
$ kill -9 csh.pid |
Supprimez le fichier nom_grappe.lock.
$ rm -f /var/tmp/nom_grappe.lock |
Quittez le PSS.
Redémarrez la grappe.
$ scadmin startcluster |
Les instances de serveur de base de données ne peuvent s'exécuter sur un noeud que si vous avez appelé l'option startnode et que le noeud a été intégré correctement à la grappe. Toutes les instances de base de données doivent être arrêtées avant d'appeler l'option stopnode.
Si vous utilisez Oracle7 Parallel Server, Oracle8 Parallel Server ou Informix XPS, consultez la documentation du produit correspondant pour connaître les détails de la procédure d'arrêt.
Si vous utilisez la commande stopnode pendant que l'instance Oracle7 ou Oracle8 est en cours d'exécution sur le noeud, stopnode bloque, et le message suivant apparaît sur la console :
ID[vxclust] : arrêt : attente de la fin de l'exécution des applications |
Il faut arrêter l'instance Oracle7 ou Oracle8 pour que la commande stopnode s'exécute correctement.
L'exécution de la commande stopnode pendant que l'instance Informix-Online XPS est exécutée sur le noeud provoque le blocage de la base de données et la rend inutilisable.