Guide d'administration système de Sun Cluster 3.1 10/03

Chapitre 3 Arrêt et initialisation d'un cluster

Ce chapitre indique les procédures à suivre pour arrêter ou initialiser un cluster ou des noeuds de cluster individuels.

Pour obtenir une description détaillée des procédures évoquées dans ce chapitre, reportez-vous au Tableau 3–1 et au Tableau 3–2.

Arrêt et initialisation d'un cluster : présentation

La commande Sun Cluster scshutdown (1M) arrête les fonctions du cluster de manière ordonnée et ferme correctement l'ensemble du cluster. Vous pouvez utiliser la commande scshutdown lorsque vous modifiez l'emplacement d'un cluster. Vous pouvez également l'utiliser pour arrêter le cluster si une corruption de données est causée par une erreur d'application.


Remarque :

pour garantir un arrêt correct de l'ensemble du cluster, utilisez la commande scshutdown au lieu des commandes shutdown ou halt. La commande shutdown de Solaris, associée à la commande scswitch (1M) permet de fermer les noeuds individuels. Pour de plus amples informations, reportez-vous à la rubrique Arrêt d'un cluster ou à Arrêt et initialisation d'un seul noeud de cluster .


La commande scshutdown procède de la manière suivante pour arrêter l'ensemble des noeuds de cluster :

  1. Mise hors ligne de tous les groupes de ressources en cours d'exécution.

  2. Démontage de tous les systèmes de fichiers du cluster.

  3. Arrêt des services de périphériques actifs.

  4. Exécution de la commande init 0 et retour à l'invite PROM ok sur tous les noeuds.


Remarque :

si nécessaire, vous pouvez initialiser un noeud en mode non cluster pour qu'il ne soit pas membre du cluster. Cela peut être utile lors de l'installation du logiciel de cluster ou de l'exécution de certaines procédures administratives. Reportez-vous à la rubrique Initialisation d'un noeud de cluster en mode non cluster pour obtenir de plus amples informations.


Tableau 3–1 Liste des tâches : arrêt et initialisation d'un cluster

Tâche 

Instructions 

Arrêt du cluster 

    -Utilisez scshutdown (1M)

Arrêt d'un cluster

Démarrage du cluster en initialisant tous les noeuds. 

Les noeuds doivent disposer d'une connexion fonctionnelle avec l'interconnexion du cluster pour devenir membres de ce dernier.  

Initialisation d'un cluster

Réinitialisation du cluster 

    -Utilisez scshutdown

À l'invite ok , initialisez chaque noeud individuellement à l'aide de la commande boot(1M).

Les noeuds doivent disposer d'une connexion fonctionnelle avec l'interconnexion du cluster pour devenir membres de ce dernier. 

Réinitialisation d'un cluster

Arrêt d'un cluster


Attention : Attention :

n'utilisez pas send brk sur une console de cluster pour arrêter un noeud de cluster. La commande n'est pas prise en charge dans un cluster. Si vous utilisez send brk avec la commande go à l'invite ok de réinitialisation, le noeud ne saura pas comment réagir.


  1. Si Oracle® Parallel Server ou Real Application Clusters s'exécute sur votre cluster, fermez toutes les instances de la base de données.

    Reportez-vous à la documentation d'Oracle Parallel Server/Real Application Clusters pour connaître les procédures d'arrêt.

  2. Devenez superutilisateur sur un noeud du cluster.

  3. Arrêtez immédiatement le cluster.

    Sur un noeud du cluster, entrez la commande suivante :


    # scshutdown -g0 -y
    

  4. Vérifiez que tous les noeuds apparaissent à l'invite ok.

    Ne mettez aucun noeud hors tension tant que tous les noeuds du cluster n'apparaissent pas à l'invite ok.

  5. Si nécessaire, mettez les noeuds hors tension.

Exemple : arrêt d'un cluster

L'exemple suivant reproduit l'affichage de la console lors d'un arrêt normal du cluster avec retour de tous les noeuds à l'invite ok. L'option -g 0 remet à zéro le délai d'arrêt et -y répond automatiquement oui à la demande de confirmation. Les messages d'arrêt apparaissent également sur les consoles des autres noeuds du cluster.


# scshutdown -g0 -y
May 2 10:08:46 phys-schost-1 cl_runtime:
WARNING: CMM monitoring disabled.
phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
/etc/rc0.d/K05initrgm: Calling scswitch -S (evacuate)
The system is down.
syncing file systems... done
Program terminated
ok 

Étape suivante

Reportez-vous à la rubrique Initialisation d'un cluster pour relancer un cluster préalablement arrêté.

Initialisation d'un cluster

  1. Pour démarrer un cluster dont les noeuds ont été arrêtés et apparaissent à l'invite ok, utilisez la commande boot(1M) sur chaque noeud.

    Si vous modifiez la configuration entre les arrêts, initialisez d'abord le noeud dont la configuration est la plus récente. Hormis dans cette situation, l'ordre d'initialisation des noeuds n'a aucune incidence.


    ok boot
    

    Des messages apparaissent sur les consoles des noeuds initialisés à mesure que vous activez des composants de cluster.


    Remarque :

    les noeuds de cluster doivent avoir une connexion fonctionnelle avec l'interconnexion du cluster pour en devenir membres.


  2. Vérifiez que les noeuds sont correctement initialisés et qu'ils sont en ligne.

    La commande scstat(1M) récapitule le statut des noeuds.


    # scstat -n
    


    Remarque :

    si le système de fichiers /var du noeud d'un cluster est saturé, il est possible que Sun Cluster ne puisse pas redémarrer sur ce noeud. Si cela se produit, reportez-vous à la rubrique Réparation d'un système de fichiers /var saturé.


Exemple : initialisation d'un cluster

L'exemple suivant reproduit l'affichage de la console lors de l'initialisation du noeud phys-schost-1 dans le cluster. Des messages similaires apparaissent sur les consoles des autres noeuds du cluster.


ok boot
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster
NOTICE: Node 1 with votecount = 1 added.
NOTICE: Node 2 with votecount = 1 added.
NOTICE: Node 3 with votecount = 1 added.
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 2 (incarnation # 937690106) has become reachable.
NOTICE: Node 3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
NOTICE: node 1 is up; new incarnation number = 937846227.
NOTICE: node 2 is up; new incarnation number = 937690106.
NOTICE: node 3 is up; new incarnation number = 937690290.
NOTICE: Cluster members:   1  2  3
...

Réinitialisation d'un cluster

 

Exécutez la commande scshutdown(1M) pour arrêter le cluster, puis initialisez le cluster sur chaque noeud à l'aide de la commande boot(1M).

  1. (Facultatif) Si un cluster exploite Oracle Parallel Server/Real Application Clusters, fermez toutes les instances de la base de données.

    Reportez-vous à la documentation d'Oracle Parallel Server/Real Application Clusters pour connaître les procédures d'arrêt.

  2. Devenez superutilisateur sur un noeud du cluster.

  3. Arrêtez le cluster.

    Sur un noeud du cluster, entrez la commande suivante :


    # scshutdown -g0 -y 
    

    Chaque noeud est arrêté à l'invite ok.


    Remarque :

    les noeuds de cluster doivent avoir une connexion fonctionnelle avec l'interconnexion du cluster pour en devenir membres.


  4. Initialisez chaque noeud.

    L'ordre d'initialisation des noeuds n'a aucune incidence, sauf si vous modifiez la configuration entre les arrêts. Si vous modifiez la configuration entre les arrêts, initialisez d'abord le noeud dont la configuration est la plus récente.


    ok boot
    

    Des messages apparaissent sur les consoles des noeuds initialisés à mesure que vous activez des composants de cluster.

  5. Vérifiez que les noeuds sont correctement initialisés et qu'ils sont en ligne.

    La commande scstat(1M) récapitule le statut des noeuds.


    # scstat -n
    


    Remarque :

    si le système de fichiers /var du noeud d'un cluster est saturé, il est possible que Sun Cluster ne puisse pas redémarrer sur ce noeud. Si cela se produit, reportez-vous à la rubrique Réparation d'un système de fichiers /var saturé.


Exemple : réinitialisation d'un cluster

L'exemple suivant reproduit l'affichage de la console lors d'un arrêt normal du cluster avec retour de tous les noeuds à l'invite ok, suivi du redémarrage du cluster. L'option -g 0 remet le délai à zéro et -y répond automatiquement oui à la demande de confirmation. Les messages d'arrêt apparaissent également sur les consoles des autres noeuds du cluster.


# scshutdown -g0 -y
May 2 10:08:46 phys-schost-1 cl_runtime:
WARNING: CMM monitoring disabled.
phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
...
The system is down.
syncing file systems... done
Program terminated
ok boot
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 2 (incarnation # 937690106) has become reachable.
NOTICE: Node 3 (incarnation # 937690290) has become reachable.
NOTICE: cluster has reached quorum.
...
NOTICE: Cluster members:   1  2  3
...
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login: 

Arrêt et initialisation d'un seul noeud de cluster


Remarque :

utilisez la commande scswitch( 1M) combinée avec la commande shutdown(1M) de Solaris pour arrêter un noeud individuel. N'utilisez la commande scshutdown que pour arrêter un cluster entier.


Tableau 3–2 Liste des tâches : arrêt et initialisation d'un noeud de cluster

Tâche 

Instructions 

Arrêt d'un noeud de cluster 

    - Utilisez scswitch(1M) et shutdown(1M)

Arrêt d'un noeud de cluster

Démarrage d'un noeud 

Le noeud doit disposer d'une connexion fonctionnelle avec l'interconnexion du cluster pour devenir membre de ce dernier. 

Initialisation d'un noeud de cluster

Arrêt et redémarrage (réinitialisation) d'un noeud de cluster. 

    - Utilisez scswitch et shutdown

Le noeud doit disposer d'une connexion fonctionnelle avec l'interconnexion du cluster pour devenir membre de ce dernier. 

Réinitialisation d'un noeud de cluster

Initialisation d'un noeud de sorte qu'il ne soit pas membre du cluster 

    - Utilisez scswitch et shutdown , puis boot -x

Initialisation d'un noeud de cluster en mode non cluster

Arrêt d'un noeud de cluster


Attention : Attention :

n'utilisez pas send brk sur une console de cluster pour arrêter un noeud de cluster. Si vous utilisez send brk et que vous entrez go à l'invite ok, le noeud ne sait pas comment réagir. Cette fonctionnalité n'est pas prise en charge au sein d'un cluster.


  1. Si votre cluster exploite Oracle Parallel Server/Real Application Clusters, fermez toutes les instances de la base de données.

    Reportez-vous à la documentation d'Oracle Parallel Server/Real Application Clusters pour connaître les procédures d'arrêt.

  2. Devenez superutilisateur sur le noeud de cluster à arrêter.

  3. Transférez vers d'autres membres du cluster tous les groupes de ressources, toutes les ressources et tous les groupes de périphériques du noeud que vous arrêtez.

    Entrez la commande suivante sur le noeud à arrêter :


    # scswitch -S -h noeud
    

    -S

    Évacue tous les services de périphériques et tous les groupes de ressources du noeud spécifié.

    -h noeud

    Indique le noeud dont vous changez les groupes de ressources et groupes de périphériques.

  4. Arrêtez le noeud du cluster.

    Entrez la commande suivante sur le noeud à arrêter :


    # shutdown -g0 -y -i0
    

  5. Vérifiez que le noeud du cluster est de retour à l'invite ok.

  6. Si nécessaire, mettez le noeud hors tension.

Exemple : arrêt d'un noeud de cluster

L'exemple suivant reproduit l'affichage de la console lors de l'arrêt du noeud phys-schost-1. L'option -g0 remet le délai à zéro, -y donne automatiquement la réponse oui à la demande de confirmation et -i0 appelle le niveau d'exécution 0 (zéro). Les messages d'arrêt de ce noeud apparaissent sur les consoles des autres noeuds du cluster.


# scswitch -S -h phys-schost-1
# shutdown -g0 -y -i0
May 2 10:08:46 phys-schost-1 cl_runtime:
 WARNING: CMM monitoring disabled.phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
Notice: rgmd is being stopped.
Notice: rpc.pmfd is being stopped.
Notice: rpc.fed is being stopped.
umount: /global/.devices/node@1 busy
umount: /global/phys-schost-1 busy
The system is down.
syncing file systems... done
Program terminated
ok 

Étape suivante

Reportez-vous à la rubrique Initialisation d'un noeud de cluster pour relancer un noeud de cluster préalablement arrêté.

Initialisation d'un noeud de cluster


Remarque :

la configuration du quorum peut avoir une incidence sur le démarrage des noeuds de cluster. Sur un cluster à deux noeuds, un périphérique de quorum doit être configuré afin que le nombre total de quorum du cluster soit de trois. Vous devez avoir un quorum pour chaque noeud et un quorum pour le périphérique de quorum. Le cas échéant, si le premier noeud est arrêté, le second noeud continue d'avoir un quorum et s'exécute en tant que membre unique du cluster. Pour le premier noeud revenant dans le cluster sous forme d'un noeud de cluster, le deuxième noeud doit être prêt et actif. Le nombre de quorum de cluster requis (deux) doit être présent.


  1. Pour faire démarrer un noeud de cluster préalablement arrêté, initialisez-le.


    ok boot
    

    Des messages apparaissent sur les consoles de tous les noeuds à mesure que des composants du cluster sont activés.


    Remarque :

    le noeud d'un cluster doit avoir une connexion fonctionnelle avec l'interconnexion du cluster pour devenir membre de cette dernière.


  2. Assurez-vous que le noeud est correctement initialisé et qu'il est en ligne.

    La commande scstat(1M) récapitule le statut du noeud.


    # scstat -n
    


    Remarque :

    si le système de fichiers /var du noeud d'un cluster est saturé, il est possible que Sun Cluster ne puisse pas redémarrer sur ce noeud. Si cela se produit, reportez-vous à la rubrique Réparation d'un système de fichiers /var saturé.


Exemple : initialisation d'un noeud de cluster

L'exemple suivant reproduit l'affichage de la console lors de l'initialisation du noeud phys-schost-1 dans le cluster.


ok boot
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
checking ufs filesystems
...
reservation program successfully exiting
Print services started.
volume management starting.
The system is ready.
phys-schost-1 console login:

Réinitialisation d'un noeud de cluster

  1. Si votre cluster exploite Oracle Parallel Server/Real Application Clusters, fermez toutes les instances de la base de données.

    Reportez-vous à la documentation d'Oracle Parallel Server/Real Application Clusters pour connaître les procédures d'arrêt.

  2. Devenez superutilisateur sur le noeud de cluster à arrêter.

  3. Arrêtez le noeud à l'aide des commandes scswitch et shutdown.

    Entrez ces commandes sur noeud à arrêter. L'option -i 6 associée à la commande shutdown réinitialise le noeud préalablement arrêté àl'invite ok.


    # scswitch -S -h noeud
    # shutdown -g0 -y -i6
    

    Remarque :

    les noeuds de cluster doivent avoir une connexion fonctionnelle avec l'interconnexion du cluster pour en devenir membres.


  4. Assurez-vous que le noeud est correctement initialisé et qu'il est en ligne.


    # scstat -n
    

Exemple : réinitialisation d'un noeud de cluster

L'exemple suivant reproduit l'affichage de la console lors de la réinitialisation du noeud phys-schost-1. Les messages relatifs à ce noeud, tels que les notifications d'arrêt et de démarrage, apparaissent sur les consoles des autres noeuds du cluster.


# scswitch -S -h phys-schost-1
# shutdown -g0 -y -i6
May 2 10:08:46 phys-schost-1 cl_runtime:
WARNING: CMM monitoring disabled.
phys-schost-1#
INIT: New run level: 6
The system is coming down.  Please wait.
System services are now being stopped.
Notice: rgmd is being stopped.
Notice: rpc.pmfd is being stopped.
Notice: rpc.fed is being stopped.
umount: /global/.devices/node@1 busy
umount: /global/phys-schost-1 busy
The system is down.
syncing file systems... done
rebooting...
Resetting ...
,,,
Sun Ultra 1 SBus (UltraSPARC 143MHz), No Keyboard
OpenBoot 3.11, 128 MB memory installed, Serial #5932401.
Ethernet address 8:8:20:99:ab:77, Host ID: 8899ab77.
...
Rebooting with command: boot
...
Hostname: phys-schost-1
Booting as part of a cluster
...
NOTICE: Node 1: attempting to join cluster
...
NOTICE: Node 1: joined cluster
...
The system is coming up.  Please wait.
The system is ready.
phys-schost-1 console login: 

Initialisation d'un noeud de cluster en mode non cluster

Vous pouvez initialiser un noeud de sorte qu'il ne soit pas membre du cluster, c'est à dire en mode non cluster. Cela peut être utile lors de l'installation du logiciel de cluster ou de l'exécution de certaines procédures administratives, par exemple l'application d'un patch à un noeud.

  1. Devenez superutilisateur sur le noeud du cluster à démarrer en mode non cluster.

  2. Arrêtez le noeud à l'aide des commandes scswitch et shutdown .


    # scswitch -S -h noeud
    # shutdown -g0 -y -i0
    

  3. Vérifiez que le noeud est de retour à l'invite ok.

  4. Initialisez le noeud en mode non cluster à l'aide de la commande boot(1M) associée à l'option -x.


    ok boot -x
    

    Des messages apparaissent sur la console du noeud, indiquant que celui-ci ne fait pas partie du cluster.

Exemple : initialisation d'un noeud de cluster en mode non cluster

L'exemple suivant reproduit l'affichage de la console lors de l'arrêt du noeud phys-schost-1, puis de son redémarrage en mode non cluster. L'option - g0 remet le délai à zéro, -y donne automatiquement la réponse oui à la demande de confirmation et -i0 appelle le niveau d'exécution 0 (zéro). Les messages d'arrêt de ce noeud apparaissent sur les consoles des autres noeuds du cluster.


# scswitch -S -h phys-schost-1
# shutdown -g0 -y -i0
May 2 10:08:46 phys-schost-1 cl_runtime:
WARNING: CMM monitoring disabled.
phys-schost-1#
...
rg_name = schost-sa-1 ...
offline node = phys-schost-2 ...
num of node = 0 ...
phys-schost-1#
INIT: New run level: 0
The system is coming down.  Please wait.
System services are now being stopped.
Print services stopped.
syslogd: going down on signal 15
...
The system is down.
syncing file systems... done
WARNING: node 1 is being shut down.
Program terminated

ok boot -x
...
Not booting as part of cluster
...
The system is ready.
phys-schost-1 console login:

Réparation d'un système de fichiers /var saturé

Solaris et le logiciel Sun Cluster envoient tous deux des messages d'erreur dans le fichier /var/adm/messages, ce qui à la longue risque de saturer le système de fichiers /var. Si le système de fichiers /var du noeud d'un cluster est saturé, il est possible que Sun Cluster ne puisse pas redémarrer sur ce noeud. En outre, vous risquez de ne plus pouvoir vous connecter à ce noeud.

Réparation d'un système de fichiers /var saturé

Si un noeud indique que son système de fichiers /var est saturé et continue d'exécuter les services Sun Cluster, procédez comme suit pour vider le système de fichiers. Pour de plus amples informations, reportez-vous à la rubrique “Viewing System Messages” in System Administration Guide: Advanced Administration.

  1. Devenez superutilisateur sur le noeud du cluster dont le système de fichiers /var est saturé.

  2. Videz le système de fichiers saturé.

    Par exemple, supprimez tous les fichiers superflus du système de fichiers.