Notes de version de Solaris 10 8/07

Reconfiguration dynamique sur les systèmes Sun Enterprise milieu de gamme

Cette section contient les dernières informations concernant la fonctionnalité de reconfiguration dynamique pour les serveurs milieu de gamme suivants exécutant le logiciel Solaris10 :

Pour plus d'informations sur la reconfiguration dynamique de Sun Enterprise Server, reportez-vous à la rubrique Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems. La version Solaris10 prend en charge les cartes mémoire/CPU et la plupart des cartes E/S dans les systèmes figurant dans la liste précédente.

Matériel compatible

Avant de continuer, assurez-vous que le système prend en charge la reconfiguration dynamique. Si votre système est ancien, le message suivant s'affiche sur votre console ou dans les journaux de votre console. Ce système n'est pas compatible avec la reconfiguration dynamique.


Hot Plug not supported in this system

Les cartes E/S suivantes ne sont actuellement pas prises en charge :

Notes logicielles

Cette section fournit des informations logicielles d'ordre général sur la reconfiguration dynamique.

Activation de la reconfiguration dynamique

Pour activer la reconfiguration dynamique, vous devez définir deux variables dans le fichier /etc/system. Vous devez également définir une variable supplémentaire pour activer la suppression des cartes mémoire/CPU. Procédez comme suit :

  1. Connectez-vous en tant que superutilisateur.

  2. Modifiez le fichier /etc/system en ajoutant les lignes suivantes :


    set pln:pln_enable_detach_suspend=1
    set soc:soc_enable_detach_suspend=1
    
  3. Pour activer la suppression d'une carte mémoire/CPU, ajoutez cette ligne au fichier :


    set kernel_cage_enable=1
    

    La définition de cette variable active l'opération d'annulation de la configuration de la mémoire.

  4. Réinitialisez le système pour appliquer les modifications.

Test de quiescence

Exécutez la commande suivante pour lancer le test de quiescence :


 # cfgadm -x quiesce-test sysctr10:slot number

Sur un système de grande taille, le test de quiescence peut durer une minute. Pendant la durée du test aucun messages n'est affiché si la commande cfgadm ne trouve aucun pilote non compatible.

Liste des cartes désactivées

Une tentative de connexion à une carte qui figure dans la liste des cartes désactivées peut produire un message d'erreur :


# cfgadm -c connect sysctrl0:slotnumber







cfgadm: Hardware specific failure: connect failed:
board is disabled: must override with [-f][-o enable-at-boot]

Vous disposez de deux options pour annuler la condition désactivée :

Pour supprimer toutes les cartes dans la liste des cartes désactivées, choisissez l'une des deux options en fonction de l'invite à partir de laquelle vous exécutez la commande :

Pour plus d'informations sur le paramètre disabled-board-list, reportez-vous à la section sur les “variables NVRAM spécifiques” du manuel Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems. Ce manuel fait partie de la documentation utilisée dans cette version.

Liste des mémoires désactivées

Des informations concernant le paramètre OpenBoot PROM disabled-memory-list sont disponibles dans cette version. Consultez la section “Specific NVRAM Variables” du manuel Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems dans la documentation Solaris concernant le matériel Sun.

Déchargement des pilotes mal séparés

Si vous devez décharger des pilotes mal séparés, utilisez la commande de ligne modinfo pour rechercher les ID de module des pilotes. Vous pouvez ensuite utiliser les ID de module dans la commande modunload pour décharger les pilotes mal séparés.

Échec du test automatique au cours d'une séquence de connexion

Retirez la carte du système le plus vite possible si le message d'erreur suivant s'affiche au cours d'une séquence de connexion de reconfiguration dynamique :


cfgadm: Hardware specific failure: connect failed: firmware operation error

La carte est tombée en panne au cours du test automatique, par conséquent le retrait de la carte permet d'éviter les erreurs de reconfiguration possibles pouvant se produire lors de la prochaine initialisation.

L'état du test automatique indiquant un échec, il n'est pas possible d'effectuer d'autres opérations. Par conséquent, si vous voulez retenter immédiatement l'opération qui a échoué, vous devez d'abord retirer et réinsérer la carte.

Bogues connus

La liste suivantes peut être modifiée à tout moment.

Échec de la suppression d'un périphérique réseau lorsqu'un programme maintient ouvert ce périphérique (5054195)

Si un processus maintient ouvert un périphérique réseau, toute opération de reconfiguration dynamique impliquant ce périphérique échoue. Les démons et les processus qui conservent des comptes de référence empêchent l'exécution des opérations de reconfiguration dynamique.

Solution : en tant que superutilisateur, procédez comme suit :

  1. Supprimez ou renommez le répertoire /rplboot.

  2. Fermez les services NFS.


    # sh /etc/init.d/nfs.server stop
    
  3. Fermez les services de serveur d'initialisation.


    # sh /etc/init.d/boot.server stop
    
  4. Exécutez l'opération de reconfiguration dynamique de séparation.

  5. Redémarrez les services NFS.


    # sh /etc/init.d/nfs.server start
    
  6. Redémarrez les services de serveur d'initialisation.


    # sh /etc/init.d/boot.server start
    

L'entrelacement de la mémoire est incorrectement défini à la suite d'une réinitialisation fatale (4156075)

L'entrelacement de la mémoire est conservé dans un état incorrect lorsqu'un serveur Sun Enterprise5 x500 est réinitialisé suite à une réinitialisation fatale. Les opérations de reconfiguration dynamique suivantes échouent. Le problème se produit uniquement sur les systèmes où l'entrelacement de la mémoire est défini sur min.

Solution : sélectionnez l'une des options suivantes :

Impossible d'annuler la configuration d'une carte mémoire/CPU comportant de la mémoire entrelacée (4210234)

Pour annuler la configuration d'une carte CPU avec de la mémoire ou d'une carte mémoire seulement et la déconnecter, vous devez d'abord configurer la mémoire. Cependant, si la mémoire sur la carte est entrelacée avec la mémoire d'autres cartes, il n'est actuellement pas possible d'annuler dynamiquement sa configuration.

Pour afficher l'entrelacement de la mémoire, utilisez la commande prtdiag ou cfgadm.

Solution : éteignez le système avant de manipuler la carte, puis réinitialisez-le une fois que vous avez terminé. Pour permettre l'exécution d'autres opérations de reconfiguration dynamique sur la carte mémoire/CPU, attribuez la valeur min à la propriété NVRAM memory-interleave. Reportez-vous également à la rubrique L'entrelacement de la mémoire est incorrectement défini à la suite d'une réinitialisation fatale (4156075) pour une discussion relative à l'entrelacement de la mémoire.

Impossible d'annuler la configuration d'une carte mémoire /CPU comportant de la mémoire permanente (4210280)

Pour annuler la configuration d'une carte CPU avec de la mémoire ou d'une carte mémoire seulement et la déconnecter, vous devez d'abord configurer la mémoire. Cependant, il existe un certain type de mémoire qui ne peut actuellement pas être relocalisée. Cette mémoire est considérée comme permanente.

Sur une carte, une mémoire permanente est signalée par la mention “permanente” dans l'affichage du statut cfgadm :


# cfgadm -s cols=ap_id:type:info
Ap_Id Type Information
ac0:bank0 memory slot3 64Mb base 0x0 permanent
ac0:bank1 memory slot3 empty
ac1:bank0 memory slot5 empty
ac1:bank1 memory slot5 64Mb base 0x40000000

Dans cet exemple, la carte de l'emplacement 3 (slot3) comporte de la mémoire permanente ; par conséquent , elle ne peut pas être retirée.

Solution : éteignez le système avant de manipuler la carte, puis réinitialisez-le une fois que vous avez terminé.

Échec de la déconnexion de cfgadm lorsque des commandes cfgadm sont exécutées simultanément (4220105)

Si un processus de commande cfgadm est exécuté sur une carte, une tentative simultanée de déconnexion d'une seconde carte échoue. Le message d'erreur suivant s'affiche :


cfgadm: Hardware specific failure: 
disconnect failed: nexus error during detach:address

Solution : exécutez une seule commande cfgadm à la fois. Permettez à l'opération cfgadm qui est exécutée sur une carte de se terminer avant de lancer une opération de déconnexion cfgadm sur une seconde carte.