Guide d'administration du systéme de Sun Cluster 2.2

Chapitre 12 Administration des disques Sun StorEdge MultiPack et Sun StorEdge D1000

Ce chapitre explique comment administrer les disques Sun StorEdge^(TM) MultiPack et Sun StorEdge D1000. Certaines des procédures décrites ici dépendent du logiciel de gestion de volumes (Solstice DiskSuiteou VxVM). Le titre de ces procédures inclut le nom du gestionnaire de volumes.

Utilisez le manuel d'entretien des disques Sun StorEdge MultiPacket Sun StorEdge D1000, ainsi que la documentation du logiciel de gestion de volumes, pour remplacer ou réparer le matériel du disque dans la configuration Sun Cluster.

Reprise après une panne de courant

Lorsque l'alimentation électrique d'un disque Sun StorEdge MultiPack ou Sun StorEdge D1000 est coupée, les opérations d'E/S produisent des erreurs qui sont détectées par le logiciel de gestion des volumes. Les erreurs ne sont pas signalées tant que des transactions d'E/S ne sont pas effectuées sur le disque.

Vous devez surveiller la configuration de ces événements à l'aide des commandes décrites au Chapitre 2.

Comment effectuer une reprise après une panne de courant (Solstice DiskSuite)

La liste qui suit énumère les étapes générales de la récupération suite à une panne de courant d'un boîtier de disque dans un environnement Solstice DiskSuite:

Identification des répliques défectueuses
Remise en service des répliques défectueuses.
Identification des périphériques défectueux.
Remise en service des périphériques défectueux.
Resynchronisation des disques.

Les étapes expliquées maintenant décrivent en détails la récupération suite à une panne de courant d'un boîtier de disque dans l'environnement Solstice DiskSuite.

Une fois l'alimentation rétablie, exécutez la commande metadb(1M) pour identifier les répliques contenant des erreurs :
# metadb -s ensemble_disques

Remettez en service les répliques.

Après la panne de courant, toutes les répliques de base de données d'état des métapériphériques qui se trouvent sur le châssis de boîtier du disque affecté affichent un état d'erreur. Etant donné que la récupération d'une réplique de la base de données d'état des métapériphériques n'est pas automatique, il est préférable d'effectuer la récupération immédiatement après la remise en service du boîtier de disque. A défaut, une nouvelle panne risque de mettre hors service la plupart des répliques et de provoquer une panne du noyau. Ce comportement de Solstice DiskSuite se produit en général lorsque le nombre de répliques disponibles n'est pas suffisant.

Bien que ces répliques erronées soient restaurées lors de la relève suivante (commande haswitch(1M) ou reboot(1M)), vous pourriez vouloir les remettre en service manuellement en les supprimant et en les ajoutant de nouveau.

Remarque :
Veillez à rajouter le même nombre de répliques que celui qui a été supprimé sur chaque tranche. Vous pouvez supprimer plusieurs répliques simultanément à l'aide de la commande metadb(1M). Si une tranche doit contenir plusieurs exemplaires des répliques, ajoutez ces dernières en exécutant une seule fois la commande metadb(1M), accompagnée de l'indicateur -c.

Exécutez la commande metastat(1M) pour identifier les métapériphériques contenant des erreurs.
# metastat -s ensemble_disques

Remettez en service les métapériphériques contenant des erreurs au moyen de la commande metareplace(1M), puis resynchronisez les disques.
# metareplace -s ensemble_disques-e miroir composant
L'option -e permet au composant (tranche) de passer à l'état de disponibilité et lance la resynchronisation.

Les composants ayant été remplacés par une réserve dynamique doivent être les derniers périphériques remplacés avec la commande metareplace(1M). Si la réserve dynamique est remplacée en premier, elle pourrait remplacer un autre sous-miroir défectueux dès qu'elle sera disponible.

Vous ne pouvez resynchroniser qu'un seul composant de sous-miroir (métapériphérique) à la fois. Si tous les composants d'un sous-miroir ont été touchés par la panne de courant, chaque composant doit être remplacé séparément. La resynchronisation d'un disque de 1,05 Go demande environ 10 minutes.

Si les deux ensembles de disques d'une configuration symétrique ont été touchés par la panne de courant, vous pouvez resynchroniser en même temps les sous-miroirs touchés de chaque ensemble de disques. Connectez-vous séparément à chaque hôte afin de récupérer l'ensemble de disques de chacun d'eux en lançant la commande metareplace(1M) pour chacun.

Remarque :
Selon le nombre de sous-miroirs et de composants figurant dans ces sous-miroirs, la resynchronisation peut demander beaucoup de temps. Un seul sous-miroir composé de 30 unités de 1,05 Go peut exiger environ cinq heures, tandis qu'une configuration comprenant des sous-miroirs à cinq composants peut n'exiger que 50 minutes.

Comment effectuer une reprise après une panne de courant (VxVM)

Les pannes de courant peuvent provoquer la déconnexion des unités de disques et donc des périphériques virtuels, qui ne sont alors plus disponibles. Le volume demeure toutefois actif, car les périphériques virtuels qui restent dans un volume mis en miroir sont toujours disponibles. Il est possible de reconnecter les unités de disque et de remédier à la situation sans arrêter les noeuds de la grappe.

La liste qui suit énumère les étapes générales de la récupération suite à une panne de courant d'un boîtier de disque dans une configuration VxVM:

Identification des périphériques virtuels défectueux à l'aide des commandes vxprint et vxdisk.
Correction du problème qui a causé la panne de courant.
Utilisation des commandes drvconfig et disks pour créer les entrées /devices et /dev.
Analyse de la configuration de disque actuelle.
Reconnexion des disques qui contenaient des erreurs temporaires.
Vérification de la présence d'autres erreurs.
(Facultatif) Dans le cas de groupes de disques partagés, exécution de la commande vxdg pour chaque disque dont l'alimentation a été coupée.
Lancement de la récupération de volume.

Les étapes expliquées maintenant décrivent en détails la récupération suite à une panne de courant d'un boîtier de disque dans une configuration VxVM.

Exécutez la commande vxprint pour afficher les périphériques virtuels défectueux.

Vous pouvez également spécifier un groupe de disques avec l'option -g groupe_disques.

Exécutez la commande vxdisk pour identifier les disques contenant des erreurs.

# vxdisk list
DEVICE       TYPE      DISK         GROUP        STATUS 
.. 
-            -         c1t5d0       toi          failed was:c1t5d0s2 
...

Corrigez l'erreur qui a causé le problème afin de rétablir l'alimentation électrique de tous les disques en panne.

Vérifiez que les disques tournent avant de poursuivre.

Entrez les commandes suivantes sur tous les noeuds de la grappe.

Dans certains cas, les disques doivent être de nouveau reconnus par les noeuds.
# drvconfig # disks

Entrez les commandes suivantes sur tous les noeuds de la grappe.

Le gestionnaire de volumes doit analyser de nouveau la configuration de disque actuelle.
# vxdctl enable # vxdisk -a online

Entrez la commande suivante sur tous les noeuds de la grappe.

Remarque :
Pour la fonction de grappe de VxVM (utilisée avec Oracle Parallel Server), entrez la commande d'abord sur le noeud maître, et ensuite seulement sur les noeuds restants.

Ainsi, vous reconnecterez les disques qui comportaient une anomalie temporaire et vous amorcerez leur récupération.
# vxreattach -r

Vérifiez la sortie de la commande vxdisk pour repérer toute autre erreur éventuelle.
# vxdisk list

Si le support a été remplacé, entrez la commande suivante depuis le noeud maître pour chaque disque ayant été déconnecté.

Le disque physique et le nom d'accès du gestionnaire de volumes de ce disque doivent être reconnectés.

# vxdg -g groupe_disques -k adddisk nom_support=nom_accès

Les valeurs pour nom_support et nom_accès figurent à la fin de la sortie de la commande vxdisk list.

Exemple :

# vxdg -g toi -k adddisk c1t5d0=c1t5d0s2
# vxdg -g toi -k adddisk c1t5d1=c1t5d1s2
# vxdg -g toi -k adddisk c1t5d2=c1t5d2s2
# vxdg -g toi -k adddisk c1t5d3=c1t5d3s2
# vxdg -g toi -k adddisk c1t5d4=c1t5d4s2

Vous pouvez également rattacher les disques à l'aide de la commande vxdiskadm ou de l'interface graphique.

Depuis le noeud, lancez la récupération du volume.
# vxrecover -bv [-g groupe_disques]
Si vous disposez de groupes de disques partagés, utilisez les options -svc de la commande vxrecover.

(Facultatif) Exécutez la commande vxprint -g pour afficher les modifications.

Administration des disques Sun StorEdge MultiPack et Sun StorEdge D1000

Cette section explique les procédures nécessaires à l'administration des composants Sun StorEdge MultiPack et Sun StorEdge D1000. Utilisez les procédures qui figurent dans le manuel du matériel du serveur pour identifier le composant défectueux.

Réparation d'une connexion Sun StorEdge MultiPack ou Sun StorEdge D1000

Lorsque la connexion entre un boîtier de disque et un noeud de la grappe est défectueuse, l'anomalie est sans doute imputable à un câble SCSI-2 ou une carte SBus défaillante.

Dans tous les cas, le noeud sur lequel la panne s'est produite se met à générer des erreurs lorsque la panne est découverte. Les accès subséquents au boîtier de disque produisent d'autres erreurs. Le noeud présente le même comportement que si l'alimentation du boîtier de disque avait été coupée.

Les opérations d'E/S effectuées depuis les autres noeuds de la grappe ne sont pas touchées par ce type de panne.

Pour diagnostiquer la panne, vous pouvez avoir recours aux procédures d'essai du module de carte qui figurent dans le manuel d'entretien du noeud Sun Cluster, afin de déterminer quel composant est défectueux. Vous devez normalement libérer un noeud et le boîtier de disque qui semble être en panne afin de dépanner le matériel.

Comment réparer une connexion Sun StorEdge MultiPack ou Sun StorEdge D1000

Préparez le système Sun Cluster comme pour un remplacement de composants.

Selon la cause de la perte de connexion, préparez le noeud Sun Cluster en effectuant l'une des procédures suivantes.
- Si le composant défectueux est une carte SBus, voir le Chapitre 7, afin de préparer le noeud Sun Cluster en vue de la mise hors tension.
- Si le problème provient d'un câble SCSI-2 défectueux, le logiciel de gestion de volumes aura détecté l'anomalie et préparé le système en vue du remplacement du câble.

Remplacez le composant défectueux.

Si le câble SCSI-2 ou la carte SBus tombe en panne, reportez-vous au manuel d'entretien du noeud Sun Cluster pour les instructions sur le remplacement de ces éléments.

Corrigez les erreurs du logiciel de gestion de volumes.

Effectuez les procédures décrites à la section "Reprise après une panne de courant".

Ajout d'un disque Sun StorEdge MultiPackou Sun StorEdge D1000

Vous pouvez ajouter des Sun StorEdge MultiPack ou Sun StorEdge D1000à une configuration Sun Cluster à tout moment.

Vous devez passer en revue la configuration du groupe de disques dans votre configuration Sun Cluster avant d'ajouter un boîtier de disque. Les considérations exposées au Chapitre 2 du Sun Cluster 2.2 Software Installation Guide et à l'Annexe A du présent manuel vous aideront à évaluer l'impact du boîtier de disque sur la configuration des groupes de disques.

Comment ajouter un disque Sun StorEdge MultiPack ou Sun StorEdge D1000

Arrêtez un des noeuds de la grappe.

Utilisez la procédure décrite à la section "Arrêt de la grappe et des noeuds de grappe" pour arrêter le noeud.

Au besoin, installez une carte SBus supplémentaire dans le noeud.

Suivez les instructions du manuel d'entretien du noeud Sun Clusterpour installer la carte SBus.

Remarque :
Installez la carte SBus dans le premier emplacement SBus disponibles, après toutes les autres cartes du noeud. Ainsi, la numérotation du contrôleur sera préservée si l'environnement d'exploitation Solaris est réinstallé. Pour de plus amples informations à ce sujet, voir "Désignation et numérotation des instances".

Branchez les câbles SCSI-2 au boîtier de disque.

Suivez les instructions du manuel d'entretien du noeud Sun Cluster.

Définissez l'ID de l'initiateur SCSI comme il convient.

Suivez les instructions du manuel d'entretien du noeud Sun Cluster.

Effectuez une réinitialisation de reconfiguration du noeud.
ok boot -r

Exécutez la commande haswitch(1M) afin que le noeud réinitialisé devienne propriétaire de tous les hôtes logiques pouvant faire l'objet d'une maîtrise.
phys-hahost1# haswitch phys-hahost2 hahost1 hahost2

Répétez Étape 1 jusqu'à Étape 5 pour les autres noeuds connectés à ce boîtier de disque.

Au besoin, réattribuez la propriété des hôtes logiques au maître par défaut approprié.

Exemple :
phys-hahost1# haswitch phys-hahost2 hahost2

Ajoutez les disques des boîtiers de disque au groupe de disques sélectionné.

Suivez les instructions de la documentation du gestionnaire de volumes pour ajouter les disques au(x) groupe(s) de disques sélectionné(s). Reportez-vous également aux annexes du Sun Cluster 2.2 Software Installation Guide pour plus de détails sur Solstice DiskSuite ou VxVM.

Administration des disques Sun StorEdge MultiPack et Sun StorEdge D1000

Dans le cadre de l'administration standard de Sun Cluster, il vous incombe de surveiller l'état de la configuration. Pour de plus amples informations sur les méthodes de surveillance, voir le Chapitre 2. Durant le processus de surveillance, vous pouvez découvrir des problèmes avec les disques multihôtes. Les procédures suivantes décrivent la correction de ces problèmes.

Sun Cluster prend en charge divers types de disque. Pour la description du boîtier de disque, reportez-vous au manuel d'entretien de l'unité d'expansion de disque multihôtes.

Ajout de disques Sun StorEdge MultiPack ou Sun StorEdge D1000

Dans une configuration symétrique, le boîtier de disque peut contenir des disques de plusieurs groupes de disques : un seul noeud doit être propriétaire de tous les groupes de disques visés.

Comment ajouter un disque Sun StorEdge MultiPack ou Sun StorEdge D1000

La liste qui suit énumère les étapes générales d'ajout d'un disque Sun StorEdge MultiPack ou Sun StorEdge D1000:

Identification du contrôleur de ce nouveau disque et d'un emplacement libre dans le boîtier de disque.
Ajout du nouveau disque.
Exécution des tâches administratives pour la préparation du disque pour son utilisation par Sun Cluster.
- Création des fichiers spéciaux /devices et des liens /dev/dsk et /dev/rdsk.
- Ajout du disque au groupe de disques.
- Formatage et partitionnement du disque, au besoin.
- Exécution des tâches administratives liées à la gestion de volumes.

Les étapes expliquées maintenant décrivent en détails l'ajout d'un disque Sun StorEdge MultiPack ou Sun StorEdge D1000.

Déterminez le numéro de contrôleur du boîtier de disque auquel le disque doit être ajouté.

Utilisez la commande mount(1M) ou format(1M) pour déterminer le numéro du contrôleur.

Repérez un emplacement de disque disponible et adapté dans le boîtier de disque en vue de l'ajout du disque.

Identifiez les emplacements libres en observant les DEL des unités de disque situées sur le devant du boîtier de disque ou en enlevant le couvercle gauche de l'unité. Les ID d'adresse qui correspondent aux emplacements figurent sur la partie médiane de la baie d'unité.

Dans les étapes suivantes, le plateau 2 est utilisé à titre d'exemple. L'emplacement sélectionné pour le nouveau disque est le plateau 2, emplacement 7. Le nouveau disque porte la désignation c2t3d1.

Ajoutez le nouveau disque.

Suivez les instructions du manuel d'entretien du boîtier de disque afin d'ajouter le matériel (disque).

Exécutez les commandes drvconfig(1M) et disks(1M) pour créer les nouvelles entrées dans /devices, /dev/dsk et /dev/rdsk pour tous les nouveaux disques.
phys-hahost1# drvconfig phys-hahost1# disks

Transférez la propriété des hôtes logiques à l'autre noeud de la grappe auquel le disque est connecté.
phys-hahost1# haswitch phys-hahost2 hahost1 hahost2

Exécutez les commandes drvconfig(1M) et disks(1M) sur le noeud à présent propriétaire du groupe de disques auquel le disque va être ajouté.
phys-hahost2# drvconfig phys-hahost2# disks

Ajoutez le disque à un groupe de disques à l'aide du logiciel de gestion de volumes.

Pour Solstice DiskSuite, la syntaxe de la commande est la suivante, où ensemble_disques représente le nom de l'ensemble de disques contenant le disque défectueux et unité le nom DID du disque au format dN (pour les nouvelles installations de Sun Cluster), ou cNtYdZ (pour les installations ayant fait l'objet d'une mise à niveau à partir de HA 1.3) :
# metaset -s ensemble_disques -a unité
Pour VxVM, vous pouvez utiliser la ligne de commande ou d'interface graphique pour ajouter le disque au groupe de disques.

Attention :
Si vous utilisez Solstice DiskSuite, la commande metaset(1M) peut repartitionner automatiquement ce disque. Pour de plus amples informations, voir la documentation de Solstice DiskSuite.

(Configuration Solstice DiskSuite exclusivement) Une fois les disques ajoutés à l'ensemble de disques avec la commande metaset(1M), exécutez la commande scadmin(1M) pour réserver et activer le mode failfast sur les disques spécifiés.
phys-hahost1# scadmin reserve nom_unité

Exécutez les tâches administratives habituelles pour le nouveau disque.

Vous pouvez maintenant effectuer les étapes d'administration normales qu'on doit exécuter lorsqu'une nouvelle unité est mise en service. Pour de plus amples renseignements sur ces tâches, reportez-vous à la documentation du logiciel de gestion de volumes.

Au besoin, réattribuez les hôtes logiques à leurs maîtres par défaut.

Remplacement des disques Sun StorEdge MultiPack ou Sun StorEdge D1000

Cette section décrit le remplacement d'un disque multihôtes sans interruption des services de Sun Cluster (remplacement en ligne) lorsque le gestionnaire de volumes signale des problèmes tels que :

Composant dans l'état Maintenance exigée.
Remplacement de réserve dynamique.
Erreurs de disque intermittentes.

Consultez la documentation du logiciel de gestion de volumes pour connaître les méthodes de remplacement hors ligne.

Comment remplacer un disque Sun StorEdge MultiPack ou Sun StorEdge D1000(Solstice DiskSuite)

Utilisez la procédure qui suit si vous avez déterminé que des composants d'un disque sont dans l'état Maintenance exigée, si une réserve dynamique a remplacé un composant ou si un disque génère des erreurs intermittentes.

La liste qui suit énumère les étapes générales du remplacement d'un disque Sun StorEdge MultiPackou Sun StorEdge D1000 dans une configuration Solstice DiskSuite.

Identification du disque qui doit être remplacé.
Identification de l'unité d'expansion de disque qui renferme le disque à remplacer.
Retrait du disque défectueux de l'ensemble de disques.
Arrêt du disque et ouverture du boîtier de disque.
Remplacement de l'unité de disque.
Exécution de la commande scdidadm -R.
Ajout du nouveau disque à l'ensemble de disques.
Mise en réserve et activation du mode failfast sur le disque.
Partitionnement du nouveau disque.
Exécution de la commande metastat(1M) pour vérifier si le problème a été corrigé.

Les étapes expliquées maintenant décrivent en détails le remplacement d'un disque Sun StorEdge MultiPack ou Sun StorEdge D1000défectueux dans une configuration Solstice DiskSuite.

Appliquez la procédure sur l'hôte maître de l'ensemble de disques dans lequel se trouve le disque défectueux. Pour cela, vous devrez peut-être commuter sur l'ensemble de disques à l'aide de la commande haswitch(1M).

Déterminez quel disque doit être remplacé.

Exécutez la commande metastat(1M) et produisez la sortie /var/adm/messages.

Si la commande metastat(1M) signale qu'un périphérique est en état de maintenance ou que des composants ont été remplacés par des réserves dynamiques, vous devez trouver et remplacer le périphérique en question. Un exemple de sortie de la commande metastat(1M) est présenté ci-après. Dans cet exemple, le périphérique c3t3d4s0 est en état de maintenance :

phys-hahost1# metastat -s hahost1
... 
d50:Submirror of hahost1/d40 
     State: Needs Maintenance 
     Stripe 0: 
         Device       Start Block      Dbase      State          Hot Spare 
         c3t3d4s0     0                No         Okay           c3t5d4s0 
...

Vérifiez /var/adm/messages afin de déterminer quel type de problème a été détecté.

...
Jun 1 16:15:26 host1 unix: 
WARNING: /io-unit@f,e1200000/sbi@0.0/SUNW,pln@a0000000,741022/ssd@3,4(ssd49):   
Jun 1 16:15:26 host1 unix: Error for command `write(I))' Err
Jun 1 16:15:27 host1 unix: or Level: Fatal
Jun 1 16:15:27 host1 unix: Requested Block 144004, Error Block: 715559
Jun 1 16:15:27 host1 unix: Sense Key: Media Error
Jun 1 16:15:27 host1 unix: Vendor `CONNER':
Jun 1 16:15:27 host1 unix: ASC=0x10(ID CRC or ECC error),ASCQ=0x0,FRU=0x15
...

Déterminez l'emplacement du disque défectueux.

Utilisez la commande mount(1M) ou format(1M) pour déterminer le numéro du contrôleur.

Si le disque défectueux contient des répliques, prenez note de la tranche et du numéro, puis supprimez les répliques.

Exécutez la commande metadb(1M) pour supprimer les répliques.

Déconnectez tous les sous-miroirs avec composants sur le disque à remplacer.

Si vous déconnectez un sous-miroir qui comporte un composant défectueux, vous devez commander la déconnexion au moyen de l'option metadetach -f. L'exemple suivant déconnecte le sous-miroir d50 du métamiroir d40.
phys-hahost1# metadetach -s hahost1 -f d40 d50

Exécutez la commande metaclear(1M) afin de vider les sous-miroirs déconnectés à Étape 5.
phys-hahost1# metaclear -s hahost1 -f d50

Si le disque défectueux contient des réserves dynamiques, prenez note du nom des périphériques et de la liste des périphériques qui contiennent des pools de réserves dynamiques, puis supprimez les réserves dynamiques.

Exécutez la commande metahs(1M) pour supprimer les réserves dynamiques.

Attention :
Vous devez prendre note des informations avant de supprimer les objets, afin de pouvoir procéder dans l'ordre inverse des opérations suite au remplacement du disque.

Exécutez la commande metaset(1M) afin de supprimer le disque défectueux de l'ensemble de disques.

La syntaxe de la commande est la suivante, où ensemble_disques représente le nom de l'ensemble de disques contenant le disque défectueux et unité le nom DID du disque dans le format dN (pour les nouvelles installations de Sun Cluster) ou cNtYdZ (pour les installations mises à niveau à partir de HA 1.3) :
phys-hahost1# metaset -s ensemble_disques -d unité
Cette opération peut nécessiter 15 minutes ou plus, selon la taille de la configuration et le nombre de disques.

Remplacez le disque défectueux.

Pour plus de détails, reportez-vous aux manuels d'entretien du boîtier de disque.

Vérifiez si le nouveau disque tourne.

Le disque doit tourner automatiquement.

Mettez à jour la base de données de pilotes DID en précisant l'ID du nouveau périphérique.

Remarque :
Si vous avez effectué une mise à niveau depuis HA 1.3, le système n'utilise pas le programme pilote DID. Si c'est le cas, sautez cette étape.

Utilisez l'indicateur -l de la commande scdidadm(1M) pour identifier le nom DID du périphérique de bas niveau de l'unité à remplacer. Mettez ensuite à jour la base de données des pilotes DID en utilisant l'indicateur -R avec la commande scdidadm(1M). Consultez le Sun Cluster 2.2 Software Installation Guide pour des détails complémentaires sur le pseudo-pilote DID.
phys-hahost1# scdidadm -o name -l /dev/rdsk/c3t3d4 6 phys-hahost1:/dev/rdsk/c3t3d4 /dev/did/rdsk/d6 phys-hahost1# scdidadm -R d6

Rajoutez le nouveau disque dans l'ensemble de disques à l'aide de la commande metaset(1M).

Cette étape rajoute automatiquement le nombre adéquat de répliques qui ont été supprimées du disque défectueux. La syntaxe de la commande est indiquée ci-après. Dans cet exemple, ensemble_disques représente le nom de l'ensemble de disques contenant le disque défectueux et unité le nom DID du disque dans le format dN (pour les nouvelles installations de Sun Cluster) ou cNtYdZ (pour les installations mises à niveau à partir de la version HA 1.3).
phys-hahost1# metaset -s ensemble_disques -a unité
Cette opération peut demander 15 minutes et même davantage, selon la taille de la configuration et le nombre de disques.

Exécutez la commande scadmin(1M) pour réserver et activer le mode failfast sur le disque spécifié qui vient d'être rajouté à l'ensemble de disques.
phys-hahost1# scadmin reserve c3t3d4

Exécutez la commande format(1M) ou fmthard(1M) pour repartitionner le nouveau disque.

Veillez à partitionner le nouveau disque exactement de la même manière que l'ancien. (L'enregistrement des données de format du disque est recommandé au Chapitre 1.)

Exécutez la commande metainit(1M) pour réinitialiser les disques supprimés à l'Étape 6.
phys-hahost1# metainit -s hahost1 d50

Attachez les sous-miroirs déconnectés à l'Étape 5.

Pour ce faire, exécutez la commande metattach(1M). Pour plus de détails, consultez la page de manuel metattach(1M).
phys-hahost1# metattach -s hahost1 d40 d50

Restaurez toutes les réserves dynamiques supprimées à l'Étape 7.

Exécutez la commande metahs(1M) pour rajouter les réserves dynamiques. Pour plus de détails, consultez la page de manuel metahs(1M).
phys-hahost1# metahs -s hahost1 -a hsp000 c3t2d5s0

Vérifiez si le remplacement a remédié au problème.
phys-hahost1# metastat -s hahost1

Comment remplacer un disque Sun StorEdge MultiPack ou Sun StorEdge D1000 (VxVM)

La liste qui suit énumère les étapes générales du remplacement d'un disque Sun StorEdge MultiPackou Sun StorEdge D1000 dans une configuration VxVM.

Retrait du disque défectueux du boîtier de disque au moyen de la commande vxdiskadm.
Remplacement du disque défectueux.
Remplacement du disque retiré auparavant au moyen de la commande vxdiskadm.

Remarque :
Pour les systèmes n'utilisant pas des groupes de disques partagés, le noeud maître est le noeud qui a importé le groupe de disques.

Si vous utilisez des groupes de disques partagés, déterminez le noeud maître et le noeud esclave en entrant la commande suivante sur tous les noeuds de la grappe :
# vxdctl -c mode
Remarque :
Effectuez les étapes suivantes depuis le noeud maître.

Déterminez si le disque en question a connu des pannes et s'il est en état NODEVICE.

Si ce n'est pas le cas, passez à l'Étape 8.

Exécutez l'utilitaire vxdiskadm puis entrez 4 (Retirer un disque en vue du remplacement).

Cette option retire un disque physique tout en conservant son nom. L'utilitaire vous demande ensuite de spécifier le périphérique à remplacer.

Entrez le nom du disque ou list.

L'exemple suivant illustre le retrait du disque c2t8d0.

Enter disk name [<disk>,list,q,?] list
Disk group: rootdg 
DM NAME         DEVICE       TYPE     PRIVLEN  PUBLEN   STATE 
... 
Disk group: demo 
DM NAME         DEVICE       TYPE     PRIVLEN  PUBLEN   STATE 
dm c1t2d0       c2t2d0s2     sliced   1519     4152640  - 
dm c1t3d0       c2t3d0s2     sliced   1519     4152640  - 
dm c1t4d0       c2t4d0s2     sliced   1519     4152640  - 
dm c1t5d0       c2t5d0s2     sliced   1519     4152640  - 
dm c1t8d0       c2t8d0s2     sliced   1519     4152640  - 
dm c1t9d0       c2t9d0s2     sliced   1519     4152640  - 
dm c2t2d0       c1t2d0s2     sliced   1519     4152640  - 
dm c2t3d0       c1t3d0s2     sliced   1519     4152640  - 
dm c2t4d0       c1t4d0s2     sliced   1519     4152640  - 
dm c2t5d0       c1t5d0s2     sliced   1519     4152640  - 
dm c2t8d0       c1t8d0s2     sliced   1519     4152640  - 
dm c2t9d0       c1t9d0s2     sliced   1519     4152640  - 
Enter disk name [<disk>,list,q,?] c2t8d0
  The requested operation is to remove disk c2t8d0 from disk group 
demo. The disk name will be kept, along with any volumes using 
the disk, allowing replacement of the disk. 

Select "Replace a failed or removed disk" from the main menu 
when you wish to replace the disk.

Tapez y ou Entrée pour continuer.

Continue with operation? [y,n,q,?] (default: y) y
  Removal of disk c2t8d0 completed successfully.

Tapez q pour quitter l'utilitaire.

Remove another disk? [y,n,q,?] (default: n) q

Tapez vxdisk list et vxprint pour visualiser les changements.

Le disque exemple c2t8d0 a été retiré.

# vxdisk list
. 
c2t3d0s2     sliced    c1t3d0       demo         online shared 
c2t4d0s2     sliced    c1t4d0       demo         online shared 
c2t5d0s2     sliced    c1t5d0       demo         online shared 
c2t8d0s2     sliced    c1t8d0       demo         online shared 
c2t9d0s2     sliced    c1t9d0       demo         online shared 
-            -         c2t8d0       demo         removed 
# vxprint
. 
dm c2t3d0       c1t3d0s2     -        4152640  -        -        -        - 
dm c2t4d0       c1t4d0s2     -        4152640  -        -        -        - 
dm c2t5d0       c1t5d0s2     -        4152640  -        -        -        - 
dm c2t8d0       -            -        -        -        REMOVED  -        - 
dm c2t9d0       c1t9d0s2     -        4152640  -        -        -        - 
pl demo05-02    -            DISABLED 51200    -        REMOVED  -        - 
sd c2t8d0-1     demo05-02    DISABLED 51200    0        REMOVED  -       - 
. 
. 
.

Remplacez l'unité physique sans mettre hors tension aucun composant.

Pour plus de détails, reportez-vous à la documentation fournie avec le boîtier de disque.

Remarque :

Pendant que vous remplacez l'unité, des messages semblables à ceux de l'exemple suivant peuvent apparaître sur la console système. Ne vous alarmez pas, car ces messages ne révèlent pas la présence d'un problème. Poursuivez plutôt le remplacement, conformément aux étapes décrites ci-après.

3 nov 17:44:00 updb10a unix: WARNING: /sbus@1f,0/SUNW,fas@0,8800000/sd@2,0 (sd17) : 
3 nov 17:44:00 updb10a unix : SCSI transport failed: reason "incomplete": \ 
retrying command 
3 Nov 17:44:03 updb10a unix: WARNING: /sbus@1f,0/SUNW,fas@0,8800000/sd@2,0 (sd17) : 
3 nov 17:44:03 updb10a unix : disk not responding to selection

Exécutez l'utilitaire vxdiskadm puis tapez 5 (Remplacer un disque défectueux ou retiré).

Entrez le nom du disque.

Vous pouvez taper list pour afficher la liste des disques dont l'état est REMOVED.

Remarque :

L'état apparent du disque peut être NODEVICE s'il a subi des pannes.

Select a removed or failed disk [<disk>,list,q,?] list
Disk group: rootdg DM NAME         DEVICE       TYPE     PRIVLEN  PUBLEN   
STATE ... Disk group: demo DM NAME         DEVICE       TYPE     PRIVLEN  PUBLEN   
STATE dm c2t8d0       -            -        -        -        REMOVED 
Select a removed or failed disk [<disk>,list,q,?] c2t8d0

L'utilitaire vxdiskadm détecte le nouveau périphérique et vous demande si celui-ci doit remplacer le périphérique retiré.

Remarque :

Si d'autres disques inutilisés sont reliés au système, l'utilitaire vxdiskadm propose également ces disques à titre de choix valable.

Entrez le nom du périphérique ou, si l'utilitaire indique le périphérique par défaut, appuyez sur Entrée.

 The following devices are available as replacements: 
        c1t8d0s2 
  You can choose one of these disks to replace c2t8d0. 
  Choose "none" to initialize another disk to replace c2t8d0. 
Choose a device, or select "none" 
[<device>,none,q,?] (default: c1t8d0s2) <Return>
The requested operation is to use the initialized device c1t8d0s2 
to replace the removed or failed disk c2t8d0 in disk group demo.

Tapez y ou Entrée pour confirmer votre volonté de faire de ce périphérique (dans l'exemple, c1t8d0s2) le disque de replacement.

Continue with operation? [y,n,q,?] (default: y) <Entrée>
   Replacement of disk c2t8d0 in group demo with disk device 
   c1t8d0s2 completed successfully.

Tapez n ou Entrée pour quitter l'utilitaire.

Replace another disk? [y,n,q,?] (default: n)  <Entrée>

Tapez vxdisk list et vxprint pour visualiser les changements.

L'état du disque d'exemple, c2t8d0, n'est plus REMOVED.

# vxdisk list
... 
c2t2d0s2     sliced    c1t2d0       demo         online shared 
c2t3d0s2     sliced    c1t3d0       demo         online shared 
c2t4d0s2     sliced    c1t4d0       demo         online shared 
c2t5d0s2     sliced    c1t5d0       demo         online shared 
c2t8d0s2     sliced    c1t8d0       demo         online shared 
c2t9d0s2     sliced    c1t9d0       demo         online shared 
# vxprint
... 
dm c2t4d0       c1t4d0s2     -        4152640  -        -        -       - 
dm c2t5d0       c1t5d0s2     -        4152640  -        -        -       - 
dm c2t8d0       c1t8d0s2     -        4152640  -        -        -       - 
dm c2t9d0       c1t9d0s2     -        4152640  -        -        -       - 
...

Remplacement des boîtiers Sun StorEdge MultiPackou Sun StorEdge D1000

Cette section explique comment remplacer un boîtier complet Sun StorEdge MultiPack ou Sun StorEdge D1000 exécutant VxVM.

Comment remplacer un boîtier Sun StorEdge MultiPack ou Sun StorEdge D1000 (VxVM)

La liste qui suit énumère les étapes générales du remplacement d'un boîtier complet Sun StorEdge MultiPackou Sun StorEdge D1000 défectueux dans une configuration VxVM:

Retrait de tous les disques du boîtier de disque défectueux au moyen de la commande vxdiskadm
Remplacement du boîtier de disque défectueux
Remise en place de tous les disques précédemment retirés dans le nouveau boîtier de disque au moyen de la commande vxdiskadm

Remarque :
Pour les systèmes n'utilisant pas des groupes de disques partagés, le noeud maître est le noeud qui a importé le groupe de disques.

Si vous utilisez des groupes de disques partagés, déterminez le noeud maître et le noeud esclave en entrant la commande suivante sur tous les noeuds de la grappe :
# vxdctl -c mode
Remarque :
Effectuez les étapes suivantes depuis le noeud maître.

Retirez tous les disques du boîtier de disque défectueux en exécutant l'utilitaire vxdiskadm et en tapant 4 (Retirer un disque en vue d'un remplacement).

Remarque :
Cette option ne permet de retirer qu'un seul disque à la fois. Répétez cette procédure pour chaque disque.

Tapez la commande list.

Dans l'exemple suivant, on suppose que le boîtier de disque du contrôleur c2 doit être remplacé. Selon le résultat de la commande list, les noms VxVM de ces disques sont c2t2d0, c2t3d0, c2t4d0, c2t5d0, c2t8d0 et c2t9d0.

Remove a disk for replacement 
Menu: VolumeManager/Disk/RemoveForReplace 
   Use this menu operation to remove a physical disk from a disk 
   group, while retaining the disk name. This changes the state 
   for the disk name to a "removed" disk. If there are any 
   initialized disks that are not part of a disk group, you will be 
   given the option of using one of these disks as a replacement. 
Enter disk name [<disk>,list,q,?] list
Disk group: rootdg 
DM NAME         DEVICE       TYPE     PRIVLEN  PUBLEN   STATE 
... 
Disk group: demo 
DM NAME         DEVICE       TYPE     PRIVLEN  PUBLEN   STATE 
dm c1t2d0       c2t2d0s2     sliced   1519     4152640  - 
dm c1t3d0       c2t3d0s2     sliced   1519     4152640  - 
dm c1t4d0       c2t4d0s2     sliced   1519     4152640  - 
dm c1t5d0       c2t5d0s2     sliced   1519     4152640  - 
dm c1t8d0       c2t8d0s2     sliced   1519     4152640  - 
dm c1t9d0       c2t9d0s2     sliced   1519     4152640  - 
dm c2t2d0       c1t2d0s2     sliced   1519     4152640  - 
dm c2t3d0       c1t3d0s2     sliced   1519     4152640  - 
dm c2t4d0       c1t4d0s2     sliced   1519     4152640  - 
dm c2t5d0       c1t5d0s2     sliced   1519     4152640  - 
dm c2t8d0       c1t8d0s2     sliced   1519     4152640  - 
dm c2t9d0       c1t9d0s2     sliced   1519     4152640  -

Tapez le nom du disque (dans cet exemple, c2t2d0).

Enter disk name [<disk>,list,q,?] c2t2d0
  The following volumes will lose mirrors as a result of this 
  operation: 
        demo-1 
No data on these volumes will be lost. 
The requested operation is to remove disk c2t2d0 from disk group 
demo. The disk name will be kept, along with any volumes using 
the disk, allowing replacement of the disk. 
Select "Replace a failed or removed disk" from the main menu 
when you wish to replace the disk.

Tapez y ou Entrée pour confirmer votre volonté de remplacer le disque.

Continue with operation? [y,n,q,?] (default: y) <Entrée>
  Removal of disk c2t2d0 completed successfully.

Tapez y pour continuer.

Remove another disk? [y,n,q,?] (default: n) y
Remove a disk for replacement 
Menu: VolumeManager/Disk/RemoveForReplace 
   Use this menu operation to remove a physical disk from a disk 
   group, while retaining the disk name. This changes the state 
   for the disk name to a "removed" disk. If there are any 
   initialized disks that are not part of a disk group, you will be 
   given the option of using one of these disks as a replacement.

Tapez le nom du disque suivant dans l'exemple, c2t3d0.

Enter disk name [<disk>,list,q,?] c2t3d0
  The following volumes will lose mirrors as a result of this 
  operation: 
      demo-2 
  No data on these volumes will be lost. 
The following devices are available as replacements: 
        c1t2d0 
  You can choose one of these disks now, to replace c2t3d0. 
  Select "none" if you do not wish to select a replacement disk.

Tapez none au besoin.

Remarque :
Cette interrogation survient chaque fois que l'utilitaire repère un disque correct dans le système. Si aucun disque correct n'est trouvé, cette interrogation n'apparaît pas.
Choose a device, or select "none" [<device>,none,q,?] (default: c1t2d0) none

Tapez y ou Entrée pour confirmer votre volonté de supprimer le disque.

The requested operation is to remove disk c2t3d0 from disk group 
  demo. The disk name will be kept, along with any volumes using 
  the disk, allowing replacement of the disk. 
  Select "Replace a failed or removed disk" from the main menu 
  when you wish to replace the disk. 
Continue with operation? [y,n,q,?] (default: y) <Entrée>
  Removal of disk c2t3d0 completed successfully.

Répétez l'Étape 6 jusqu'à l'Étape 9 pour chaque disque indiqué à l'Étape 3.

Mettez le boîtier de disque hors tension puis remplacez-le.

Pour de plus amples renseignements, reportez-vous à la documentation du boîtier de disque.

Remarque :

Pendant que vous remplacez le boîtier de disque, des messages semblables à ceux de l'exemple suivant peuvent être affichés sur la console système. Ne vous alarmez pas, car ces messages ne révèlent pas la présence d'un problème. Poursuivez plutôt le remplacement, conformément aux étapes décrites dans la section suivante.

3 nov 17:44:00 updb10a unix: WARNING: /sbus@1f,0/SUNW,fas@0,8800000/sd@2,0 (sd17) : 
3 nov 17:44:00 updb10a unix : SCSI transport failed: reason "incomplete": \ 
retrying command 
3 nov 17:44:03 updb10a unix: WARNING: /sbus@1f,0/SUNW,fas@0,8800000/sd@2,0 (sd17) : 
3 nov 17:44:03 updb10a unix : disk not responding to selection

Mettez le boîtier de disque sous tension.

Pour de plus amples renseignements, reportez-vous au manuel d'entretien du boîtier de disque.

Connectez tous les disques précédemment retirés en exécutant l'utilitaire vxdiskadm et en tapant 5 (Remplacer un disque défectueux ou retiré).

Remarque :
Cette option ne permet de remplacer qu'un seul disque à la fois. Répétez cette procédure pour chaque disque.

Exécutez la commande list pour afficher la liste des noms de disque dont l'état est à présent REMOVED.

Replace a failed or removed disk 
Menu: VolumeManager/Disk/ReplaceDisk 
  Use this menu operation to specify a replacement disk for a disk 
  that you removed with the "Remove a disk for replacement" menu 
  operation, or that failed during use. You will be prompted for 
  a disk name to replace and a disk device to use as a replacement. 
  You can choose an uninitialized disk, in which case the disk will 
  be initialized, or you can choose a disk that you have already 
  initialized using the Add or initialize a disk menu operation. 
Select a removed or failed disk [<disk>,list,q,?] list
Disk group: rootdg 
DM NAME         DEVICE       TYPE     PRIVLEN  PUBLEN   STATE 
... 
Disk group: demo 
DM NAME         DEVICE       TYPE     PRIVLEN  PUBLEN   STATE 
dm c2t2d0       -            -        -        -        REMOVED 
dm c2t3d0       -            -        -        -        REMOVED 
dm c2t4d0       -            -        -        -        REMOVED 
dm c2t5d0       -            -        -        -        REMOVED 
dm c2t8d0       -            -        -        -        REMOVED 
dm c2t9d0       -            -        -        -        REMOVED

Tapez le nom du disque (dans l'exemple, c2t2d0).
Select a removed or failed disk [<disk>,list,q,?] c2t2d0 The following devices are available as replacements: c1t2d0s2 c1t3d0s2 c1t4d0s2 c1t5d0s2 c1t8d0s2 c1t9d0s2
L'utilitaire vxdiskadm détecte les nouveaux périphériques et vous demande si ceux-ci doivent remplacer les périphériques retirés.

Tapez le nom du périphérique de "remplacement" ou du "nouveau" périphérique ou, si l'utilitaire indique le périphérique par défaut, appuyez sur Entrée.

 You can choose one of these disks to replace c2t2d0. 
 Choose "none" to initialize another disk to replace c2t2d0. 
 
Choose a device, or select "none" 
[<device>,none,q,?] (default: c1t2d0s2) <Entrée>

Tapez y ou Entrée pour confirmer votre volonté de faire de ce périphérique (dans l'exemple, c1t8d0s2) le disque de remplacement.

 The requested operation is to use the initialized device c1t2d0s2 
 to replace the removed or failed disk c2t2d0 in disk group demo. 
Continue with operation? [y,n,q,?] (default: y) <Entrée>
  Replacement of disk c2t2d0 in group demo with disk device 
  c1t2d0s2 completed successfully.

Tapez y pour continuer.

Replace another disk? [y,n,q,?] (default: n) y

Répétez l'Étape 15 jusqu'à l'Étape 18 pour chacun des noms de disque ayant l'état REMOVED/NODEVICE.