Ce chapitre contient les notes de mise à jour de Alternate Pathing (AP) 2.2 sur tous les serveurs Sun Enterprise, sauf sur le serveur Sun Enterprise 10000. Pour plus d'informations sur le serveur Enterprise 10000, reportez-vous au chapitre 4 à la section "AP sur Sun Enterprise 10000".
AP 2.2 est la première version de l'AP prise en charge par Solaris 7 5/99.
AP vous permet de définir et de contrôler des chemins physiques alternatifs vers les périphériques, ce qui augmente la disponibilité et le niveau de reprise sur erreur du serveur. Si un chemin menant à un périphérique devient inutilisable, il est possible d'en utiliser un autre. Pour plus d'informations, reportez-vous au Guide de l'utilisateur de la fonctionnalité Alternate Pathing sur les serveurs Sun Enterprise dans la collection Solaris 7 5/99 on Sun Hardware.
Au moment de l'impression de ce document, AP 2.2 Bêta n'est compatible avec aucune version de Sun Enterprise Volume Manager(TM) (SEVM).
Si vous effectuez une mise à jour de l'environnement d'exploitation Solaris 2.6 vers Solaris 7 5/99 et si AP 2.1 et Solstice(TM) DiskSuite(TM) 4.0 ou 4.1 (SDS) sont installés sur votre système, vous devriez effectuer une mise à niveau vers AP 2.2 et SDS 4.2. Cette section vous indique toute la procédure à suivre et les documents à utiliser. Assurez-vous que vous possédez les publications suivantes avant de commencer cette mise à niveau :
Notes de mise à jour Supplément Solaris 7 5/99 pour les matériels Sun (disponible au format papier dans le kit média Solaris 7 5/99)
Solaris 7 5/99 Guide de la plate-forme matérielle Sun, (disponible au format papier dans le kit média Solaris 7 5/99 ou au format AnswerBook2 sur le CD Supplement Sun Hardware)
Guide de l'utilisateur de la fonctionnalité Alternate Pathing sur les serveurs Sun Enterprise (disponible au format AnswerBook2 sur le CD Supplement Sun Hardware dans le kit média Solaris 7 5/99)
Solstice DiskSuite 4.2 User's Guide (disponible au format AnswerBook2 sur le site http://docs.sun.com ou dans le kit média SDS)
Solstice DiskSuite 4.2 Installation and Product Notes (disponible au format AnswerBook2 sur le site http://docs.sun.com ou dans le kit média SDS)
Pour réussir la mise à niveau, suivez les étapes dans l'ordre indiqué ci-dessous.
En général, vous devez :
Déconfigurer SDS 4.0 ou 4.1.
Retirer AP 2.0 ou 2.1.
Effectuer une mise à niveau vers l'environnement d'exploitation Solaris 7 5/99.
Installer AP 2.2.
Installer et reconfigurer SDS 4.2.
En particulier, vous devez :
Lire "Mise à niveau de AP" dans le Solaris 7 5/99 Guide de la plate-forme matérielle Sun.
Enregistrer tous les métapériphériques AP qui ne sont pas enregistrés (reportez-vous à l'étape 1 de la "Mise à niveau vers AP 2.2" dans le Solaris 7 5/99 Guide de la plate-forme matérielle Sun).
Déconfigurer SDS (reportez-vous aux étapes 1 à 8 de "How to Convert to DiskSuite 4.2 on SPARC Systems Running DiskSuite 4.0 or 4.1" au chapitre 1 des Solstice DiskSuite 4.2 Installation and Product Notes).
N'installez pas Solaris 7 5/99 à ce stade.
Retirer la configuration AP courante (reportez-vous à l'étape 3 de la "Mise à niveau vers AP 2.2" dans le Solaris 7 5/99 Guide de la plate-forme matérielle Sun).
Effectuer une mise à niveau vers Solaris 7 5/99 (reportez-vous à l'étape 4 de la "Mise à niveau vers AP 2.2" dans le Solaris 7 5/99 Guide de la plate-forme matérielle Sun).
Effectuer une mise à niveau AP 2.2 (reportez-vous à l'étape 5 de la "Mise à niveau vers AP 2.2" dans le Solaris 7 5/99 Guide de la plate-forme matérielle Sun).
Installer SDS 4.2, puis le restaurer (reportez-vous à l'étape 6 de la "Mise à niveau vers AP 2.2 et SDS 4.2" dans le Solaris 7 5/99 Guide de la plate-forme matérielle Sun et aux étapes 10 à 16 de "How to Convert to DiskSuite 4.2 on SPARC Systems Running DiskSuite 4.0 or 4.1" au chapitre 1 des Solstice DiskSuite 4.2 Installation and Product Notes).
Cette section contient des problèmes d'ordre général qui concernent AP sur les serveurs Sun Enterprise, veuillez la lire avant d'essayer d'installer ou de configurer AP.
Les périphériques suivants sont pris en charge par le logiciel AP sur les serveurs Sun Enterprise :
Grappes SPARCstorage(TM) Arrays reconnues par AP utilisant les ports pln,soc et ssd
Sun(TM) StorEdge(TM) A5000 reconnues par AP utilisant sf, socal et ssd
SunFastEthernet(TM) 2.0 (hme)
SunFDDI(TM) 5.0 (nf) SAS (Single-Attach Station) and DAS (Dual-Attach Station)
SCSI-2/Buffered Ethernet FSBE/S and DSBE/S (le)
Quad Ethernet (qe)
Sun(TM) Quad FastEthernet(TM) (qfe)
Sun GigabitEthernet 2.0 (ge)
Le tableau suivant indique les périphériques de réseau pris en charge selon les versions:
Tableau 5-1 Périphériques de réseau pris en charge
|
AP 2.0 |
AP 2.1 |
AP 2.2 |
---|---|---|---|
Solaris 2.5.1 |
hme, le, nf, bf, hi, qe, qfe |
N/A |
N/A |
Solaris 2.6 (5/98) |
N/A |
ge, hme, le, nf, qe, qfe, vge |
N/A |
Solaris 7 5/99 |
N/A |
N/A |
ge,hme, le, nf, qe, qfe |
Des tests de validation AP 2.2 ont été effectués sur SunFDDI (révision 6.0) et sur GigabitEthernet (révision 2.0). Si vous installez l'un ou l'autre de ces périphériques, vous devez utiliser le niveau de révision qui a été testé, à moins qu'un niveau de révision supérieur existe. De plus, vous devez installer tous les patchs disponibles de ces périphériques. Pour plus d'informations sur les patchs, consultez le site http://www.sunsolve.sun.com.
Le Sun StorEdge A3000 supporte des fonctionnalités de reprise similaires à celles fournies par AP ce qui explique pourquoi ce dernier ne le prend pas en charge. Pour de plus amples informations sur le support de reprise de ce produit, reportez-vous à la documentation qui l'accompagne.
AP prend en charge Sun StorEdge A5000 dans cette version.
AP 2.2 ne prend pas en charge Sun StorEdge A7000 dans cette version.
La liste suivante contient toutes les combinaisons AP et Solaris que vous pouvez installer sur un serveur Sun Enterprise.
Solaris 2.6 5/98 avec AP 2.1 et DR
Solaris 7 avec AP 2.2 et DR
Solaris 7 5/99 avec AP 2.2 et DR
Cette section résume les bugs les plus importants numérotés et corrigés par Sun depuis AP 2.1 (Solaris 2.6 5/98). La présente liste ne contient pas tous les bugs corrigés.
4126743 - Echec de la reprise automatique du disque AP en cas de pannes simultanées de plusieurs groupes de chemins (ce bug a été corrigé par le bug 4136249).
4126897 - Le domaine "panique" en l'absence de bases de données AP, mais les entrées de métapériphériques existent encore dans /etc/vfstab.
4136249 - Les E/S des volumes SEVM RAID s'arrête après la reprise automatique de AP.
4141438 - L'interface mhme s'arrête en cas d'utilisation intense du réseau.
4143514 - FDDI avec AP s'arrête en cas d'utilisation intense du réseau.
4147674 - AP provoque l'arrêt de ifconfig sur un mutex.
4153152 - apconfig fonctionne en tant qu'utilisateur courant.
4161396 - AP 2.x a besoin de capacité pour fonctionner avec GEM.
4163270 - netstat de l'interface réseau méta AP n'indique aucun comptage.
4166620 - snoop de l'interface réseau méta AP arrête sa surveillance après une opération de commutation.
4170818 - Si vous exécutez la commande $<callouts nadb macro, or fm2's "callout ts", vous verrez des milliers de dépassement du délai imparti pour les files d'attente dans le tableau "timeshare callout".
4180055 - L'accès à un métadisque AP par un chemin alternatif actif défectueux fait paniquer le système.
4180702 - Les messages provenant de swap.c ne sont pas internationalisés.
4183581 - Le disque apboot provoque le vidage d'image mémoire lorsque le disque utilisé est le même que le disque d'initialisation courant.
4185154 - Le test de GigabitEnthernet avec une charge élevée échoue.
4188418 - Il est possible qu'une erreur du disque dur ne soit pas détectée par Veritas [SEVM].
4195441 - ap_daemon AP2.0 ne communique pas avec AP2.2.
4228731 - Les interfaces réseau inexistantes ne sont pas signalées comme étant détachées après la réinitialisation.
Ces notes de mise à jour fournissent les dernières informations sur la fonctionnalité de reconfiguration dynamique (DR, Dynamic Reconfiguration) pour les systèmes Sun EnterpriseTM 3x00, 4x00, 5x00 et 6x00 utilisant la mise à jour 5/99 de la ligne de produits SolarisTM 7 de Sun Microsystems. Pour plus d'informations sur la reconfiguration dynamique sur les serveurs Sun Enterprise, reportez-vous au guide de l'utilisateur de la fonctionnalité Dynamic Reconfiguration sur les serveurs Sun Enterprise 3x00/4x00/5x00/6x00.
La mise à jour 5/99 comprend la prise en charge des cartes UC/mémoire sur les systèmes Sun Enterprise 6x00, 5x00, 4x00 et 3x00.
Avant de poursuivre, assurez-vous que le système est compatible avec la fonctionnalité de reconfiguration dynamique. Si vous voyez le message suivant sur votre console ou dans les journaux de votre console, cela signifie que le matériel est ancien et n'est pas adapté à la reconfiguration dynamique.
Hot Plug not supported in this system
Les cartes E/S prises en charge sont répertoriées dans la section relative à "Solaris 7 5/99" sur le site Web suivant:
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
Les cartes E/S type 2 (graphique), type 3 (PCI) et type 5 (graphique et SOC+) ne sont pas actuellement prises en charge.
En ce qui concerne les grappes de disque Sun StorEdgeTM A5000 ou les unités internes FC-AL du système Sun Enterprise 3500, la version du micro-programme doit être la ST19171FC 0413 ou ultérieure. Pour plus d'informations, reportez-vous à la section relative à "Solaris 7 5/99" sur le site web suivant :
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
Les utilisateurs de Solaris 7 5/99 qui souhaitent se servir de la reconfiguration dynamique doivent utiliser la version 3.2.22 de CPU PROM (patch du micro-programme : 103346-22) ou ultérieure. Vous pouvez vous procurer ce micro-programme sur le site Web. Reportez-vous à la section "Comment vous procurer le micro-programme".
Des versions plus anciennes de CPU PROM risquent d'afficher le message suivant pendant l'initialisation :
Firmware does not support Dynamic Reconfiguration
La version 3.2.16 de CPU PROM et les versions précédentes n'affichent pas ce message, bien qu'elles ne prennent pas en charge la reconfiguration dynamique des cartes UC/mémoire.
Pour connaître le niveau de révision de PROM actuel, entrez .version et banner à l'invite ok. L'écran qui s'affiche est peut-être similaire à ce qui suit :
ok .version |
Slot 0 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 1 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 2 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 3 - I/O Type 4 FCODE 1.8.22 1999/xx/xx 19:27 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 4 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 5 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 6 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 7 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 9 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 11 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 12 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 14 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
ok banner |
16-slot Sun Enterprise E6500 |
OpenBoot 3.2.22, 4672 MB memory installed, Serial #xxxxxxxx. |
Ethernet address 8:0:xx:xx:xx:xx, Host ID: xxxxxxxx. |
Pour savoir comment mettre à niveau votre micro-programme, reportez-vous à la section relative à "Solaris 7 5/99" sur le site web suivant:
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
Ce site vous fournit les informations suivantes :
Comment décharger la PROM autorisant la fonctionnalité DR
Comment mettre à niveau la PROM
Si vous ne pouvez pas accéder au site web, contactez votre conseiller Sun agréé pour obtenir de l'aide.
Dans le fichier /etc/system, deux variables doivent être définies pour activer la reconfiguration dynamique et une autre variable doit l'être pour activer le retrait des cartes UC/mémoire.
Connectez-vous en tant que super-utilisateur.
Pour activer la reconfiguration dynamique, éditez le fichier /etc/system et ajoutez les lignes suivantes :
set pln:pln_enable_detach_suspend=1 set soc:soc_enable_detach_suspend=1
Pour activer le retrait d'une carte UC/mémoire, éditez le fichier /etc/system et ajoutez la ligne suivante :
set kernel_cage_enable=1
Définir cette variable permet l'opération de déconfiguration de la mémoire.
Réamorcez le système pour appliquer les changements.
Sur un système important, l'exécution de la commande quiesce-test (cfgadm -x quiesce-test sysctrl0:slotnuméro) peut prendre près d'une minute. Pendant ce temps, aucun message ne s'affiche si cfgadm ne trouve pas de gestionnaires incompatibles. Il s'agit d'un comportement normal.
Essayer de connecter une carte peut donner le message d'erreur suivant si la carte figure sur la liste des cartes désactivées :
# cfgadm -c connect sysctrl0:slotnuméro cfgadm: Hardware specific failure: connect failed: board is disabled: must override with [-f][-o enable-at-boot]
Pour contourner la condition désactivée, utilisez l'indicateur force (-f) ou l'option enable (-o enable-at-boot) avec la commande cfgadm, comme indiqué ci-dessous :
# cfgadm -f -c connect sysctrl0:slotnuméro
# cfgadm -o enable-at-boot -c connect sysctrl0:slotnuméro
Pour supprimer toutes les cartes de la liste des cartes désactivées, mettez la variable disabled-board-list sur un ensemble nul en entrant la commande système suivante :
# eeprom disabled-board-list=
Si vous vous trouvez à l'invite OpenBoot, utilisez la commande OBP suivante pour supprimer toutes les cartes de la liste des cartes désactivées :
OK set-default disabled-board-list
Pour plus d'informations sur le paramétrage de la variable disabled-board-list, reportez-vous à la section "Specific NVRAM Variables" dans les Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems, référence 805-4454.
Pour plus d'informations sur le paramétrage de la variable OBP disabled-memory-list, reportez-vous à la section "Specific NVRAM Variables" dans les Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems, référence 805-4454.
S'il faut décharger des gestionnaires pas sûrs en cas de détachement, utilisez la ligne de commande modinfo(1M) pour trouver le numéro des modules des gestionnaires. Vous pouvez utiliser les identifiants qui se trouvent dans la commande modunload(1M) pour décharger les gestionnaires pas sûrs en cas de détachement.
Les cartes de mémoire ou les cartes UC/mémoire qui contiennent de la mémoire entrelacée ne peuvent pas être reconfigurées de manière dynamique à l'heure actuelle.
Pour savoir si la mémoire est entrelacée, utilisez la commande prtdiag ou la commande cfgadm.
Pour autoriser les opérations DR sur les cartes UC/mémoire, mettez la NVRAM memory-interleave sur min.
Pour plus d'informations sur l'entrelacement de mémoire, reportez-vous à "Mémoire mal entrelacée après une réinitialisation fatale, Bug 4156075 " et à "DR: Ne réussit pas à déconfigurer une carte UC/Mémoire qui contient une mémoire entrelacée, Bug 4210234".
Si l'erreur "cfgadm: Hardware specific failure: connect failed: firmware operation error" s'affiche pendant une séquence de connexion DR, retirez la carte du système dès que possible. La carte a échoué à l'auto-test, et le retrait de la carte évite que des erreurs de reconfiguration éventuelles ne se produisent lors de la prochaine réinitialisation.
Si vous voulez réessayer immédiatement l'opération qui a échoué, vous devez d'abord retirer et réinsérer la carte, parce que l'état de la carte ne permet pas de faire d'autres opérations.
Comme indiqué dans le Guide de l'utilisateur de la fonctionnalité Dynamic Reconfiguration sur les systèmes Sun Enterprise 3x00/4x00/5x00/6x00, le logiciel Sun Enterprise SyMONTM de gestion et de surveillance des systèmes prend en charge la reconfiguration dynamique. Toutefois, le numéro de référence du guide de l'utilisateur est erroné. Le numéro de référence du document Sun Enterprise SyMON 2.0.1 Supplement for Sun Enterprise Midrange Servers, est le 806-0649.
Catégorie : RFE
Le test de mémoire doit occasionnellement indiquer qu'il est en cours d'exécution. Pendant un long test, l'utilisateur ne sait pas facilement si le système s'est arrêté ou non.
Procédure : Surveillez l'état du système dans une autre commande shell ou fenêtre, en utilisant vmstat(1M), ps(1), ou des commandes shell similaires.
Catégorie : Bug
L'entrelacement de la mémoire est laissé dans un mauvais état après la réinitialisation du serveur Sun Enterprise X500. Les opérations DR ultérieures échouent. Le problème se produit seulement sur des systèmes où l'entrelacement de mémoire est sur min.
Procédure : Deux options sont indiquées ci-dessous.
Corrigez le problème après sa survenance, rénitialiser manuellement le système à l'invite OK.
Evitez le problème avant qu'il ne se produise, mettre la NVRAM memory-interleave sur max. Dans ce cas, la mémoire est entrelacée toutes les fois que le système est initialisé. Cependant, vous pouvez trouver que cette option est inacceptable, étant donné qu'une carte mémoire contenant une mémoire entrelacée ne peut pas être déconfigurée de manière dynamique. Reportez-vous à "DR: Ne réussit pas à déconfigurer une carte UC/Mémoire qui contient une mémoire entrelacée, Bug 4210234".
Catégorie : Bug
vmstat montre un nombre inhabituellement élevé d'interruptions après la configuration de l'UC. Avec vmstat en arrière-plan, le champ d'interruption devient anormalement large (mais cela n'indique pas qu'un problème existe). Dans la dernière rangée de l'exemple ci-dessous, la colonne (in) des interruptions indique la valeur 4294967216:
# procs memory page disk faults cpu |
r b w swap free re mf pi po fr de sr s6 s9 s1 -- in sy cs us sy id |
0 0 0 437208 146424 0 1 4 0 0 0 0 0 1 0 0 50 65 79 0 1 99 |
0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 198 137 214 0 3 97 |
0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 286 101 200 0 3 97 |
0 0 0 413864 111072 0 11 0 0 0 0 0 0 1 0 0 4294967216 43 68 0 0 100 |
Procédure : Relancez vmstat.
Catégorie : Bug
Si deux UC d'une seule carte tombent en panne avant signalement à l'UC maîtresse, l'état du système POST indique la panne de la première UC mais pas de la deuxième.
Procédure : Aucune.
Catégorie : RFE
Ne réussit pas à déconfigurer une carte UC/Mémoire qui contient une mémoire entrelacée.
Pour déconfigurer et ensuite déconnecter une carte UC à mémoire ou une carte à mémoire seule, il faut d'abord déconfigurer la mémoire. Toutefois, si la mémoire qui se trouve sur la carte est entrelacée à la mémoire d'autres cartes, la mémoire ne peut pas être déconfigurée de manière dynamique à l'heure actuelle.
L'entrelacement de mémoire peut être affiché en utilisant les commandes prtdiag ou cfgadm.
Procédure : Mettez le système hors tension avant d'effectuer l'entretien de la carte, puis réinitialisez le système. Pour autoriser de futures opérations DR sur la carte UC/mémoire, mettez la NVRAM memory-interleave sur min. Pour plus d'informations sur l'entrelacement de mémoire, reportez-vous aussi à "Mémoire mal entrelacée après une réinitialisation fatale, Bug 4156075 ".
Catégorie : RFE
Pour déconfigurer puis déconnecter une carte UC à mémoire ou une carte à mémoire seule, il faut d'abord déconfigurer la mémoire. Toutefois, une certaine quantité de mémoire n'est pas translatable à l'heure actuelle. Cette mémoire est considérée comme étant permanente.
La mémoire permanente d'une carte est signalée par le mot "permanent" dans l'affichage d'état de la cfgadm :
# cfgadm -s cols=ap_id:type:info Ap_Id Type Information ac0:bank0 memory slot3 64Mb base 0x0 permanent ac0:bank1 memory slot3 empty ac1:bank0 memory slot5 empty ac1:bank1 memory slot5 64Mb base 0x40000000
Dans cet exemple, la carte qui se trouve dans la slot3 contient une mémoire permanente et ne peut donc pas être retirée.
Procèdure : Mettez le système hors tension avant d'effectuer l'entretien de la carte, réinitialisez le système ensuite.
Catégorie : Bug
Lorsqu'un processus cfgadm est en cours sur une carte, la déconnexion simultanée d'une deuxième carte échoue.
Echec de déconnexion cfgadm lors de l'exécution d'un autre processus cfgadm sur une autre carte. Le message suivant s'affiche :
cfgadm: Hardware specific failure: disconnect failed: nexus error during detach: address
Procédure : Faites une seule opération cfgadm à la fois. Si une opération cfgadm est en cours sur une carte, attendez qu'elle soit finie avant de lancer une opération cfgadm de déconnexion sur une deuxième carte.
Catégorie : Bug
Après l'exécution d'opérations DR, tenter de mettre le système hors tension avec la commande init 5 risque de causer une réinitialisation fatale.
Procédure : réinitialisez le système, puis mettez-le hors tension en entrant la commande power-off à l'invite ok.
Lorsqu'un serveur est configuré comme un serveur d'initialisation pour des machines clientes x86 utilisant Solaris 2.5.1, il exécute plusieurs tâches rpld en même temps, que ces périphériques soient utilisés ou non. Ces références actives empêchent que ces périphériques soient détachés lors d'opérations DR.
Procédure : Effectuez une opération DR de détachement :