Ces notes de mise à jour fournissent les dernières informations sur la fonctionnalité de reconfiguration dynamique (DR, Dynamic Reconfiguration) pour les systèmes Sun EnterpriseTM 3x00, 4x00, 5x00 et 6x00 utilisant la mise à jour SolarisTM 7 11/99. Pour plus d'informations sur la reconfiguration dynamique sur les serveurs Sun Enterprise, reportez-vous au guide de l'utilisateur de la fonctionnalité Dynamic Reconfiguration sur les serveurs Sun Enterprise 3x00/4x00/5x00/6x00.
La mise à jour 11/99 comprend la prise en charge des cartes UC/mémoire sur les systèmes Sun Enterprise 6x00, 5x00, 4x00 et 3x00.
Avant de poursuivre, assurez-vous que le système est compatible avec la fonctionnalité de reconfiguration dynamique. Si vous voyez le message suivant sur votre console ou dans les journaux de votre console, cela signifie que le matériel est ancien et n'est pas adapté à la reconfiguration dynamique.
Hot Plug not supported in this system
Les cartes E/S prises en charge sont répertoriées dans la section relative à "Solaris 7 11/99" sur le site Web suivant
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
Les cartes E/S type 2 (graphique), type 3 (PCI) et type 5 (graphique et SOC+) ne sont pas actuellement prises en charge.
En ce qui concerne les grappes de disque Sun StorEdgeTM A5000 ou les unités internes FC-AL du système Sun Enterprise 3500, la version du micro-programme doit être la ST19171FC 0413 ou ultérieure. Pour plus d'informations, reportez-vous à la section relative à "Solaris 7 11/99" sur le site web suivant :
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
Les utilisateurs de Solaris 7 11/99 qui souhaitent se servir de la reconfiguration dynamique doivent utiliser la version 3.2.22 de CPU PROM (patch du micro-programme : 103346-xx) ou ultérieure. Vous pouvez vous procurer ce micro-programme sur le site Web. Reportez-vous à la section "Comment vous procurer le micro-programme".
Des versions plus anciennes de CPU PROM risquent d'afficher le message suivant pendant l'initialisation :
Firmware does not support Dynamic Reconfiguration
La version 3.2.16 de CPU PROM et les versions précédentes n'affichent pas ce message, bien qu'elles ne prennent pas en charge la reconfiguration dynamique des cartes UC/mémoire.
Pour connaître le niveau de révision de PROM actuel, entrez .version et banner à l'invite ok. L'écran qui s'affiche est peut-être similaire à ce qui suit :
ok .version |
Slot 0 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 1 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 2 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 3 - I/O Type 4 FCODE 1.8.22 1999/xx/xx 19:27 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 4 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 5 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 6 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 7 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 9 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 11 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 12 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 14 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
ok banner |
16-slot Sun Enterprise E6500 |
OpenBoot 3.2.22, 4672 MB memory installed, Serial #xxxxxxxx. |
Ethernet address 8:0:xx:xx:xx:xx, Host ID: xxxxxxxx. |
Pour savoir comment mettre à niveau votre micro-programme, reportez-vous à la section relative à "Solaris 7 11/99" sur le site web suivant.
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
Ce site vous fournit les informations suivantes :
Comment décharger la PROM autorisant la fonctionnalité DR
Comment mettre à niveau la PROM
Si vous ne pouvez pas accéder au site web, contactez votre conseiller Sun agréé pour obtenir de l'aide.
Dans le fichier /etc/system, deux variables doivent être définies pour activer la reconfiguration dynamique et une autre variable doit l'être pour activer le retrait des cartes UC/mémoire.
Connectez-vous en tant que super-utilisateur.
Pour activer la reconfiguration dynamique, éditez le fichier /etc/system et ajoutez les lignes suivantes :
set pln:pln_enable_detach_suspend=1 set soc:soc_enable_detach_suspend=1
Pour activer le retrait d'une carte UC/mémoire, éditez le fichier /etc/system et ajoutez la ligne suivante :
set kernel_cage_enable=1
Définir cette variable permet l'opération de déconfiguration de la mémoire.
Réamorcez le système pour appliquer les changements.
Sur un système important, l'exécution de la commande quiesce-test (cfgadm -x quiesce-test sysctrl0:slotnuméro) peut prendre près d'une minute. Pendant ce temps, aucun message ne s'affiche si cfgadm ne trouve pas de gestionnaires incompatibles. Il s'agit d'un comportement normal.
Essayer de connecter une carte peut donner le message d'erreur suivant si la carte figure sur la liste des cartes désactivées :
# cfgadm -c connect sysctrl0:slotnuméro cfgadm: Hardware specific failure: connect failed: board is disabled: must override with [-f][-o enable-at-boot]
Pour contourner la condition désactivée, utilisez l'indicateur force (-f) ou l'option enable (-o enable-at-boot) avec la commande cfgadm, comme indiqué ci-dessous :
# cfgadm -f -c connect sysctrl0:slotnuméro
# cfgadm -o enable-at-boot -c connect sysctrl0:slotnuméro
Pour supprimer toutes les cartes de la liste des cartes désactivées, mettez la variable disabled-board-list sur un ensemble nul en entrant la commande système suivante :
# eeprom disabled-board-list=
Si vous vous trouvez à l'invite OpenBoot, utilisez la commande OBP suivante pour supprimer toutes les cartes de la liste des cartes désactivées :
OK set-default disabled-board-list
Pour plus d'informations sur le paramétrage de la variable disabled-board-list, reportez-vous à la section "Specific NVRAM Variables" dans les Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems, référence 805-4454.
Pour plus d'informations sur le paramétrage de la variable OBP disabled-memory-list, reportez-vous à la section "Specific NVRAM Variables" dans les Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems.
S'il faut décharger des gestionnaires pas sûrs en cas de détachement, utilisez la ligne de commande modinfo(1M) pour trouver le numéro des modules des gestionnaires. Vous pouvez utiliser les identifiants qui se trouvent dans la commande modunload(1M) pour décharger les gestionnaires pas sûrs en cas de détachement.
Les cartes de mémoire ou les cartes UC/mémoire qui contiennent de la mémoire entrelacée ne peuvent pas être reconfigurées de manière dynamique à l'heure actuelle.
Pour savoir si la mémoire est entrelacée, utilisez la commande prtdiag ou la commande cfgadm.
Pour autoriser les opérations DR sur les cartes UC/mémoire, mettez la NVRAM memory-interleave sur min.
Pour plus d'informations sur l'entrelacement de mémoire, reportez-vous à "Mémoire mal entrelacée après une réinitialisation fatale, Bug 4156075" et à "DR: Ne réussit pas à déconfigurer une carte UC/Mémoire qui contient une mémoire entrelacée, Bug 4210234".
Si l'erreur "cfgadm: Hardware specific failure: connect failed: firmware operation error" s'affiche pendant une séquence de connexion DR, retirez la carte du système dès que possible. La carte a échoué à l'auto-test, et le retrait de la carte évite que des erreurs de reconfiguration éventuelles ne se produisent lors de la prochaine réinitialisation.
Si vous voulez réessayer immédiatement l'opération qui a échoué, vous devez d'abord retirer et réinsérer la carte, parce que l'état de la carte ne permet pas de faire d'autres opérations.
Comme indiqué dans le Guide de l'utilisateur de la fonctionnalité Dynamic Reconfiguration sur les systèmes Sun Enterprise 3x00/4x00/5x00/6x00, le logiciel Sun Enterprise SyMONTM de gestion et de surveillance des systèmes prend en charge la reconfiguration dynamique. Toutefois, le numéro de référence du guide de l'utilisateur est erroné. Le numéro de référence du document Supplément Sun Enterprise SyMON 2.0.1 pour les serveurs milieu de gamme Sun Enterprise.
Pour plus d'informations sur les derniers patchs et bugs, consultez : http://sunsolve5.sun.com/sunsolve/Enterprise-dr.
Catégorie : RFE
Le test de mémoire doit occasionnellement indiquer qu'il est en cours d'exécution. Pendant un long test, l'utilisateur ne sait pas facilement si le système s'est arrêté ou non.
Procédure : Surveillez l'état du système dans une autre commande shell ou fenêtre, en utilisant vmstat(1M), ps(1), ou des commandes shell similaires.
Catégorie : Bug
L'entrelacement de la mémoire est laissé dans un mauvais état après la réinitialisation du serveur Sun Enterprise x500. Les opérations DR ultérieures échouent. Le problème se produit seulement sur des systèmes où l'entrelacement de mémoire est sur min.
Procédure : Deux options sont indiquées ci-dessous.
Corrigez le problème après sa survenance, rénitialiser manuellement le système à l'invite OK.
Evitez le problème avant qu'il ne se produise, mettre la NVRAM memory-interleave sur max. Dans ce cas, la mémoire est entrelacée toutes les fois que le système est initialisé. Cependant, vous pouvez trouver que cette option est inacceptable, étant donné qu'une carte mémoire contenant une mémoire entrelacée ne peut pas être déconfigurée de manière dynamique. Reportez-vous à "DR: Ne réussit pas à déconfigurer une carte UC/Mémoire qui contient une mémoire entrelacée, Bug 4210234".
Catégorie : Bug
vmstat montre un nombre inhabituellement élevé d'interruptions après la configuration de l'UC. Avec vmstat en arrière-plan, le champ d'interruption devient anormalement large (mais cela n'indique pas qu'un problème existe). Dans la dernière rangée de l'exemple ci-dessous, la colonne (in) des interruptions indique la valeur 4294967216:
# procs memory page disk faults cpu |
r b w swap free re mf pi po fr de sr s6 s9 s1 -- in sy cs us sy id |
0 0 0 437208 146424 0 1 4 0 0 0 0 0 1 0 0 50 65 79 0 1 99 |
0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 198 137 214 0 3 97 |
0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 286 101 200 0 3 97 |
0 0 0 413864 111072 0 11 0 0 0 0 0 0 1 0 0 4294967216 43 68 0 0 100 |
Procédure : Relancez vmstat.
Catégorie : Bug
Si deux UC d'une seule carte tombent en panne avant signalement à l'UC maîtresse, l'état du système POST indique la panne de la première UC mais pas de la deuxième.
Procédure : Aucune.
Catégorie : RFE
Ne réussit pas à déconfigurer une carte UC/Mémoire qui contient une mémoire entrelacée.
Pour déconfigurer et ensuite déconnecter une carte UC à mémoire ou une carte à mémoire seule, il faut d'abord déconfigurer la mémoire. Toutefois, si la mémoire qui se trouve sur la carte est entrelacée à la mémoire d'autres cartes, la mémoire ne peut pas être déconfigurée de manière dynamique à l'heure actuelle.
L'entrelacement de mémoire peut être affiché en utilisant les commandes prtdiag ou cfgadm.
Procédure : Mettez le système hors tension avant d'effectuer l'entretien de la carte, puis réinitialisez le système. Pour autoriser de futures opérations DR sur la carte UC/mémoire, mettez la NVRAM memory-interleave sur min. Pour plus d'informations sur l'entrelacement de mémoire, reportez-vous aussi à "Mémoire mal entrelacée après une réinitialisation fatale, Bug 4156075".
Catégorie : RFE
Pour déconfigurer puis déconnecter une carte UC à mémoire ou une carte à mémoire seule, il faut d'abord déconfigurer la mémoire. Toutefois, une certaine quantité de mémoire n'est pas translatable à l'heure actuelle. Cette mémoire est considérée comme étant permanente.
La mémoire permanente d'une carte est signalée par le mot "permanent" dans l'affichage d'état de la cfgadm :
# cfgadm -s cols=ap_id:type:info Ap_Id Type Information ac0:bank0 memory slot3 64Mb base 0x0 permanent ac0:bank1 memory slot3 empty ac1:bank0 memory slot5 empty ac1:bank1 memory slot5 64Mb base 0x40000000
Dans cet exemple, la carte qui se trouve dans la slot3 contient une mémoire permanente et ne peut donc pas être retirée.
Procédure : Mettez le système hors tension avant d'effectuer l'entretien de la carte, réinitialisez le système ensuite.
Catégorie : Bug
Lorsqu'un processus cfgadm est en cours sur une carte, la déconnexion simultanée d'une deuxième carte échoue.
Echec de déconnexion cfgadm lors de l'exécution d'un autre processus cfgadm sur une autre carte. Le message suivant s'affiche :
cfgadm: Hardware specific failure: disconnect failed: nexus error during detach: adresse
Procédure : Faites une seule opération cfgadm à la fois. Si une opération cfgadm est en cours sur une carte, attendez qu'elle soit finie avant de lancer une opération cfgadm de déconnexion sur une deuxième carte.
Catégorie : Bug
Après l'exécution d'opérations DR, tenter de mettre le système hors tension avec la commande init 5 risque de causer une réinitialisation fatale.
Procédure : réinitialisez le système, puis mettez-le hors tension en entrant la commande power-off à l'invite ok.
Lorsqu'un serveur est configuré comme un serveur d'initialisation pour des machines clientes x86 utilisant Solaris 2.5.1, il exécute plusieurs tâches rpld en même temps, que ces périphériques soient utilisés ou non. Ces références actives empêchent que ces périphériques soient détachés lors d'opérations DR.
Procédure : Effectuez une opération DR de détachement :