Guide d'administration système de Sun Cluster 3.0 U1

Chapitre 2 Arrêt et initialisation d'une grappe

Ce chapitre indique les procédures à suivre pour arrêter ou initialiser une grappe ou des noeuds de grappe individuels.

Les procédures décrites dans ce chapitre sont les suivantes :

Pour obtenir un récapitulatif des procédures décrites dans ce chapitre, reportez-vous au Tableau 2-1 et au Tableau 2-2.

2.1 Arrêt et initialisation d'une grappe : présentation

La commande Sun Cluster scshutdown(1M) permet d'interrompre les services de la grappe de façon méthodique et d'arrêter celui-ci correctement. Vous pouvez effectuer cette opération en cas de déplacement de la grappe ou d'altération des données due à une erreur d'application.


Remarque :

Pour garantir un arrêt correct de l'ensemble de la grappe, utilisez la commande scshutdown à la place des commandes shutdown ou halt. La commande Solaris shutdown permet d'arrêter des noeuds individuels, en combinaison avec la commande scswitch. Pour plus d'informations, reportez-vous aux sections "2.1.1 Arrêt d'une grappe" ou "2.2 Arrêt et initialisation d'un noeud de grappe individuel".


Pour arrêter une grappe, la commande scshutdown exécute les opérations suivantes :

  1. Mise hors ligne de tous les groupes de ressources en cours d'exécution.

  2. Démontage de tous les systèmes de fichiers de la grappe.

  3. Arrêt des services de périphériques actifs.

  4. Exécution de la commande init 0 et retour à l'invite PROM ok sur tous les noeuds.


Remarque :

Si nécessaire, vous pouvez initialiser un noeud en mode hors-grappe pour qu'il ne fasse pas partie de la grappe. Cela peut être utile lors de l'installation du logiciel de grappe ou de l'exécution de certaines procédures administratives. Pour plus d'informations, reportez-vous à la section "2.2.4 Initialisation d'un noeud de grappe en mode hors-grappe".


Tableau 2-1 Plan des tâches : arrêt et initialisation d'une grappe

Tâche 

Pour les instructions, voir... 

Arrêter la grappe 

    - Utilisez scshutdown

"2.1.1 Arrêt d'une grappe"

Faire démarrer la grappe en initialisant tous les noeuds.  

Les noeuds doivent disposer d'une connexion fonctionnelle avec l'interconnexion de la grappe pour devenir membres de ce dernier. 

"2.1.2 Initialisation d'une grappe"

Arrêter et réinitialiser la grappe 

    - Utilisez scshutdown

A l'invite ok, initialisez chaque noeud individuellement à l'aide de la commande boot.

Les noeuds doivent disposer d'une connexion fonctionnelle avec l'interconnexion de la grappe pour devenir membres de ce dernier. 

"2.1.3 Réinitialisation d'une grappe"

2.1.1 Arrêt d'une grappe


Attention : Attention :

N'utilisez pas send brk sur une console de la grappe pour arrêter un noeud de la grappe. Cette fonctionnalité n'est pas prise en charge au sein d'une grappe. Si vous utilisez send brk et entrez ensuite go à l'invite ok pour redémarrer, le noeud entrera en situation de panique.


  1. Si votre grappe utilise Oracle Parallel Server (OPS), arrêtez toutes les instances de base de données OPS.

    Reportez-vous à la documentation de Oracle Parallel Server pour les procédures d'arrêt.

  2. Devenez superutilisateur sur un noeud de la grappe.

  3. Arrêtez immédiatement la grappe.

    Sur un noeud de la grappe, entrez la commande suivante :


    # scshutdown -g0 -y
    

  4. Vérifiez que tous les noeuds sont à l'invite ok.

    Ne mettez aucun noeud hors tension tant que tous les noeuds de la grappe ne sont pas à l'invite ok.

  5. Si nécessaire, mettez les noeuds hors tension.

2.1.1.1 Exemple : arrêt d'une grappe

L'exemple suivant reproduit l'affichage de la console lors d'un arrêt normal de la grappe avec retour de tous les noeuds à l'invite ok. L'option -g 0 définit le délai de grâce d'arrêt à 0 ; -y indique au logiciel de répondre automatiquement yes à la demande de confirmation. Des messages d'arrêt apparaissent également sur les consoles des autres noeuds de la grappe.


# scshutdown -g0 -y
May 2 10:08:46 phys-schost-1 cl_runtime: WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
/etc/rc0.d/K05initrgm: Calling scswitch -S (evacuate)
The system is down.
syncing file systems... done
Program terminated
ok 

2.1.1.2 Etape suivante

Reportez-vous à la section "2.1.2 Initialisation d'une grappe" pour relancer une grappe préalablement arrêtée.

2.1.2 Initialisation d'une grappe

  1. Pour faire démarrer une grappe dont les noeuds ont été arrêtés et se trouvent à l'invite PROM ok, vous devez initialiser chaque noeud.

    Si vous modifiez la configuration entre les arrêts, initialisez d'abord le noeud dont la configuration est la plus récente. Hormis dans cette situation, l'ordre d'initialisation des noeuds n'a aucune incidence.


    ok boot
    

    Des messages apparaissent sur les consoles des noeuds initialisés à mesure que vous activez des composants de la grappe.


    Remarque :

    Les noeuds de la grappe doivent avoir une connexion fonctionnelle avec l'interconnexion de la grappe pour devenir membres de ce dernier.


  2. Vérifiez que les noeuds sont correctement initialisés et qu'ils sont en ligne.

    La commande scstat(1M) permet d'obtenir un rapport sur l'état des noeuds.


    # scstat -n
    


    Remarque :

    Si le système de fichiers /var d'un noeud de grappe devient saturé, Sun Cluster risque de ne pas pouvoir redémarrer sur ce noeud. Si cela se produit, reportez-vous à la section "2.3.1 Réparation d'un système de fichiers /var saturé".


2.1.2.1 Exemple : initialisation d'une grappe

L'exemple suivant reproduit l'affichage de la console lors de l'initialisation du noeud phys-schost-1 dans la grappe. Des messages similaires apparaissent sur les consoles des autres noeuds de la grappe.


ok boot
Rebooting with command: boot 
...
Hostname: phys-schost-1
Booting as part of a cluster
NOTICE: Node 1 with votecount = 1 added.
NOTICE: Node 2 with votecount = 1 added.
NOTICE: Node 3 with votecount = 1 added.
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 2 (incarnation # 937690106) has become reachable.
NOTICE: Node 3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
NOTICE: node 1 is up; new incarnation number = 937846227.
NOTICE: node 2 is up; new incarnation number = 937690106.
NOTICE: node 3 is up; new incarnation number = 937690290.
NOTICE: Cluster members:   1  2  3
...

2.1.3 Réinitialisation d'une grappe

Exécutez la commande scshutdown(1M) pour arrêter la grappe, puis initialisez la grappe sur chaque noeud à l'aide de la commande boot.

  1. (Facultatif). Pour les grappes qui exécutent Oracle Parallel Server (OPS), arrêtez toutes les instances de la base de données OPS.

    Reportez-vous à la documentation de Oracle Parallel Server pour les procédures d'arrêt.

  2. Devenez superutilisateur sur un noeud de la grappe.

  3. Arrêtez la grappe.

    Sur un noeud de la grappe, entrez la commande suivante :


    # scshutdown -g0 -y 
    

    Chaque noeud est arrêté et ramené à l'invite ok.


    Remarque :

    Les noeuds de la grappe doivent avoir une connexion fonctionnelle avec l'interconnexion de la grappe pour devenir membres de ce dernier.


  4. Initialisez chaque noeud.

    L'ordre d'initialisation des noeuds n'a aucune incidence, sauf si vous modifiez la configuration entre les arrêts. Dans ce cas, vous devez commencer par initialiser le noeud dont la configuration est la plus récente.


    ok boot
    

    Des messages apparaissent sur les consoles des noeuds initialisés à mesure que vous activez des composants de la grappe.

  5. Vérifiez que les noeuds sont correctement initialisés et qu'ils sont en ligne.

    La commande scstat permet d'obtenir un rapport sur l'état des noeuds.


    # scstat -n
    


    Remarque :

    Si le système de fichiers /var d'un noeud de grappe devient saturé, Sun Cluster risque de ne pas pouvoir redémarrer sur ce noeud. Si cela se produit, reportez-vous à la section "2.3.1 Réparation d'un système de fichiers /var saturé".


2.1.3.1 Exemple : réinitialisation d'une grappe

L'exemple suivant reproduit l'affichage de la console lors d'un arrêt normal de la grappe avec retour de tous les noeuds à l'invite ok, suivi du redémarrage de la grappe. L'option -g 0 définit le délai de grâce à 0 ; -y indique au logiciel de répondre automatiquement yes à la demande de confirmation. Des messages d'arrêt apparaissent également sur les consoles des autres noeuds de la grappe.


# scshutdown -g0 -y
May 2 10:08:46 phys-schost-1 cl_runtime: WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
...
The system is down.
syncing file systems... done
Program terminated
ok boot
Rebooting with command: boot 
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 2 (incarnation # 937690106) has become reachable.
NOTICE: Node 3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
...
NOTICE: Cluster members:   1  2  3
...
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login: 

2.2 Arrêt et initialisation d'un noeud de grappe individuel


Remarque :

Utilisez la commande scswitch en conjonction avec la commande Solaris shutdown pour arrêter un noeud individuel. N'utilisez la commande scshutdown que pour arrêter l'ensemble de la grappe.


Tableau 2-2 Plan des tâches : arrêt et initialisation d'un noeud de grappe

Tâche 

Pour les instructions, voir... 

Arrêter un noeud de grappe  

    - Utilisez les commandes scswitch(1M) et shutdown(1M)

"2.2.1 Arrêt d'un noeud de grappe"

Faire démarrer un noeud en l'initialisant 

Le noeud doit disposer d'une connexion fonctionnelle avec l'interconnexion de la grappe pour devenir membre de ce dernier. 

"2.2.2 Initialisation d'un noeud de grappe"

Arrêter et réinitialiser un noeud de grappe  

    - Utilisez les commandes scswitch et shutdown

Le noeud doit disposer d'une connexion fonctionnelle avec l'interconnexion de la grappe pour devenir membre de ce dernier. 

"2.2.3 Réinitialisation d'un noeud de grappe"

Initialiser un noeud de sorte qu'il ne soit pas membre de la grappe 

    - Utilisez les commandes scswitch et shutdown, puis boot -x

"2.2.4 Initialisation d'un noeud de grappe en mode hors-grappe"

2.2.1 Arrêt d'un noeud de grappe


Attention : Attention :

N'utilisez pas send brk sur une console de la grappe pour arrêter un noeud de la grappe. Si vous utilisez send brk et entrez ensuite go à l'invite ok pour redémarrer, le noeud entrera en situation de panique. Cette fonctionnalité n'est pas prise en charge au sein d'une grappe.


  1. Pour les noeuds de la grappe qui exécutent Oracle Parallel Server (OPS), arrêtez toutes les instances de la base de données OPS.

    Reportez-vous à la documentation de Oracle Parallel Server pour les procédures d'arrêt.

  2. Devenez superutilisateur sur le noeud de grappe à arrêter.

  3. Transférez vers d'autres membres de la grappe tous les groupes de ressources, toutes les ressources et tous les groupes de périphériques du noeud que vous arrêtez.

    Entrez la commande suivante sur le noeud à arrêter :


    # scswitch -S -h liste_noeuds
    

    -S

    Evacue tous les services de périphériques et groupes de ressources du noeud spécifié.

    -h liste_noeuds

    Indique le noeud dont vous changez les groupes de ressources et groupes d'unités.

  4. Arrêtez le noeud de la grappe.

    Entrez la commande suivante sur le noeud à arrêter :


    # shutdown -g0 -y -i0
    

  5. Vérifiez que le noeud de la grappe est à l'invite ok.

  6. Si nécessaire, mettez le noeud hors tension.

2.2.1.1 Exemple : arrêt d'un noeud de grappe

L'exemple suivant reproduit l'affichage de la console lors de l'arrêt du noeud phys-schost-1. L'option -g0 définit le délai de grâce à 0 ; -y indique au logiciel de répondre automatiquement yes à la demande de confirmation ; -i0 appelle le niveau d'exécution 0 (zéro). Les messages d'arrêt de ce noeud apparaissent sur les consoles des autres noeuds de la grappe.


# scswitch -S -h phys-schost-1
# shutdown -g0 -y -i0
May 2 10:08:46 phys-schost-1 cl_runtime: WARNING: CMM monitoring disabled.phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
Notice: rgmd is being stopped.
Notice: rpc.pmfd is being stopped.
Notice: rpc.fed is being stopped.
umount: /global/.devices/node@1 busy
umount: /global/phys-schost-1 busy
The system is down.
syncing file systems... done
Program terminated
ok 

2.2.1.2 Etape suivante

Reportez-vous à la section "2.2.2 Initialisation d'un noeud de grappe" pour relancer un noeud de grappe préalablement arrêté.

2.2.2 Initialisation d'un noeud de grappe


Remarque :

La configuration du quorum peut avoir une incidence sur le démarrage d'un noeud de grappe. Dans les grappes comportant deux noeuds, vous devez avoir un périphérique de quorum configuré de sorte que le quorum total de la grappe soit de trois (un pour chaque noeud et un pour le périphérique de quorum). Le cas échéant, si le premier noeud est arrêté, le second noeud continue d'avoir un quorum et s'exécute en tant que membre unique de la grappe. Pour que le premier noeud revienne dans la grappe en tant que noeud de cette grappe, le second noeud doit être actif et le quorum requis pour la grappe (2) doit être présent.


  1. Pour faire démarrer un noeud de grappe préalablement arrêté, initialisez-le.


    ok boot
    

    Des messages apparaissent sur les consoles de tous les noeuds à mesure que des composants de la grappe sont activés.


    Remarque :

    Un noeud de la grappe doit avoir une connexion fonctionnelle avec l'interconnexion de la grappe pour devenir membre de ce dernier.


  2. Vérifiez que le noeud est correctement initialisé et qu'il est en ligne.

    La commande scstat(1M) permet d'obtenir un rapport sur l'état d'un noeud.


    # scstat -n
    


    Remarque :

    Si le système de fichiers /var d'un noeud de grappe devient saturé, Sun Cluster risque de ne pas pouvoir redémarrer sur ce noeud. Si cela se produit, reportez-vous à la section "2.3.1 Réparation d'un système de fichiers /var saturé".


2.2.2.1 Exemple : initialisation d'un noeud de grappe

L'exemple suivant reproduit l'affichage de la console lors de l'initialisation du noeud phys-schost-1 dans la grappe.


ok boot
Rebooting with command: boot 
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:

2.2.3 Réinitialisation d'un noeud de grappe

  1. Pour les noeuds de la grappe qui exécutent Oracle Parallel Server (OPS), arrêtez toutes les instances de la base de données OPS.

    Reportez-vous à la documentation de Oracle Parallel Server pour les procédures d'arrêt.

  2. Devenez superutilisateur sur le noeud de grappe à arrêter.

  3. Arrêtez le noeud de grappe à l'aide des commandes scswitch et shutdown.

    Entrez ces commandes sur le noeud de grappe à arrêter. L'option -i 6 de la commande shutdown entraîne une réinitialisation automatique du noeud après son retour à l'invite ok.


    # scswitch -S -h liste_noeuds
    # shutdown -g0 -y -i6
    

    Remarque :

    Les noeuds de la grappe doivent avoir une connexion fonctionnelle avec l'interconnexion de la grappe pour devenir membres de ce dernier.


  4. Vérifiez que le noeud est correctement initialisé et qu'il est en ligne.


    # scstat -n
    

2.2.3.1 Exemple : réinitialisation d'un noeud de grappe

L'exemple suivant reproduit l'affichage de la console lors de l'arrêt et du redémarrage du noeud phys-schost-1. Les messages d'arrêt et de démarrage de ce noeud apparaissent sur les consoles des autres noeuds de la grappe.


# scswitch -S -h phys-schost-1
# shutdown -g0 -y -i6
May 2 10:08:46 phys-schost-1 cl_runtime: WARNING: CMM monitoring disabled.
phys-schost-1# 
INIT: New run level: 6
The system is coming down.  Please wait.
System services are now being stopped.
Notice: rgmd is being stopped.
Notice: rpc.pmfd is being stopped.
Notice: rpc.fed is being stopped.
umount: /global/.devices/node@1 busy
umount: /global/phys-schost-1 busy
The system is down.
syncing file systems... done
rebooting...
Resetting ... 
,,,
Sun Ultra 1 SBus (UltraSPARC 143MHz), No Keyboard
OpenBoot 3.11, 128 MB memory installed, Serial #5932401.
Ethernet address 8:8:20:99:ab:77, Host ID: 8899ab77.
...
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
The system is ready.
phys-schost-1 console login: 

2.2.4 Initialisation d'un noeud de grappe en mode hors-grappe

Vous pouvez initialiser un noeud en mode hors-grappe pour qu'il ne fasse pas partie de la grappe. Cela peut être utile lors de l'installation du logiciel de grappe ou de l'exécution de certaines procédures administratives, par exemple l'application d'un correctif à un noeud.

  1. Devenez superutilisateur sur le noeud de grappe à démarrer en mode hors-grappe.

  2. Arrêtez le noeud à l'aide des commandes scswitch et shutdown.


    # scswitch -S -h liste_noeuds
    # shutdown -g0 -y -i0
    

  3. Vérifiez que le noeud est à l'invite ok.

  4. Initialisez le noeud en mode hors-grappe à l'aide de la commande boot(1M) et de l'option -x.


    ok boot -x
    

    Des messages apparaissent sur la console du noeud, indiquant que celui-ci ne fait pas partie de la grappe.

2.2.4.1 Exemple : initialisation d'un noeud de grappe en mode hors-grappe

L'exemple suivant reproduit l'affichage de la console lors de l'arrêt du noeud phys-schost-1, puis de son redémarrage en mode hors-grappe. L'option -g0 définit le délai de grâce à 0 ; -y indique au logiciel de répondre automatiquement yes à la demande de confirmation ; -i0 appelle le niveau d'exécution 0 (zéro). Les messages d'arrêt de ce noeud apparaissent sur les consoles des autres noeuds de la grappe.


# scswitch -S -h phys-schost-1
# shutdown -g0 -y -i0
May 2 10:08:46 phys-schost-1 cl_runtime: WARNING: CMM monitoring disabled.
phys-schost-1# 
...
rg_name = schost-sa-1 ...
offline node = phys-schost-2 ...
num of  node = 0 ...
phys-schost-1# 
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
Print services stopped.
syslogd: going down on signal 15
...
The system is down.
syncing file systems... done
WARNING: node 1 is being shut down.
Program terminated
ok boot -x
...
Not booting as part of cluster
...
The system is ready.
phys-schost-1 console login:

2.3 Réparation d'un système de fichiers /var saturé

Solaris et Sun Cluster envoient tous deux des messages d'erreur dans le fichier /var/adm/messagesce qui, à la longue, risque de saturer le système de fichiers /var. Si le système de fichiers /var d'un noeud de grappe devient saturé, Sun Cluster risque de ne pas pouvoir redémarrer sur ce noeud. En outre, vous risquez de ne plus pouvoir vous connecter à ce noeud.

2.3.1 Réparation d'un système de fichiers /var saturé

Si un noeud indique que son système de fichiers /var est saturé et continue d'exécuter les services Sun Cluster, procédez comme suit pour vider le système de fichiers.

  1. Devenez superutilisateur sur le noeud de la grappe dont le système de fichiers /var est saturé.

  2. Videz le système de fichiers saturé.

    Par exemple, supprimez tous les fichiers superflus du système de fichiers.