Ce chapitre décrit les problèmes spécifiques aux serveurs Sun milieu de gamme et haut de gamme. Les serveurs Sun actuels appartiennent à la gamme système Sun Fire. Les serveurs plus anciens appartiennent à la gamme système Sun Enterprise.
Les notes de version de Sun Validation Test Suite constituent désormais un document distinct et sont disponibles sur le site http://sun.com.
Certains des problèmes et bogues répertoriés dans ce chapitre ont été corrigés dans les versions suivantes de Solaris10. Si vous avez mis à niveau votre logiciel Solaris, certains problèmes et bogues présentés dans ce chapitre ne s'appliquent peut-être plus. Pour connaître les bogues et problèmes qui ne s'appliquent plus à votre logiciel Solaris10, reportez-vous à l'Annexe A, Tableau des bogues intégrés résolus dans le système d'exploitation Solaris 10.
Cette section décrit les principaux bogues DR côté domaine sur les systèmes haut de gamme Sun Fire qui exécutent le logiciel Solaris10. Ces systèmes sont les suivants :
Sun Fire 25K ;
Sun Fire 20K ;
Sun Fire 15K ;
Sun Fire 12K.
Pour plus d'informations sur les bogues de reconfiguration dynamique sur les services de Sun Management Services, reportez-vous aux SMS Release Notes de la version SMS en cours d'exécution sur votre système.
Ces informations concernent uniquement la reconfiguration dynamique exécutée sur les serveurs répertoriés dans cette section. Pour obtenir des informations sur la reconfiguration dynamique sur d'autres serveurs, reportez-vous aux notes de version ou aux notes de produit décrivant les serveurs correspondants.
Les bogues logiciels et matériels suivants concernent les systèmes haut de gamme Sun Fire.
Des avertissements peuvent s'afficher lorsqu'une commande de reconfiguration dynamique est exécutée sur un système configuré avec la carte SunSwift PCI, Option 1032. Ces avertissements se produisent sur des domaines qui exécutent le logiciel Solaris 8, Solaris 9 ou Solaris10. L'avertissement suivant est un exemple :
Aug 12 12:27:41 machine genunix: WARNING: vmem_destroy('pcisch2_dvma'): leaked |
Ces avertissements sont bénins. L'espace d'accès direct à la mémoire virtuelle est correctement rafraîchi au cours de l'opération de reconfiguration dynamique. Aucune véritable fuite de la mémoire du noyau ne se produit.
Solution : pour empêcher l'affichage de ces avertissements, ajoutez la ligne suivante au fichier /etc/system :
set pcisch:pci_preserve_iommu_tsb=0 |
La liaison entre un système avec une carte réseau Sun GigaSwift Ethernet MMF Option X1151A et certains commutateurs CISCO échoue. Ce problème se produit lorsque vous essayez d'exécuter une opération de reconfiguration dynamique sur un système connecté à l'un des commutateurs suivants :
Commutateur CISCO WS-c4003 (pare-feu : logiciel WS-C4003, Version NmpSW : 4.4(1))
Commutateur CISCO WS-c4003 (pare-feu : logiciel WS-C4003, Version NmpSW : 7.1(2))
Commutateur CISCO WS-c5500 (pare-feu : logiciel WS-C5500, Version McpSW : 4.2(1) et NmpSW : 4.2(1))
Ce problème ne se produit pas sur un commutateur CISCO 6509.
Solution : utilisez un autre commutateur. Vous pouvez également vous procurer, auprès de Cisco, un patch pour les commutateurs dans la liste.
Cette section décrit les problèmes principaux liés à la reconfiguration dynamique sur les systèmes Sun Fire milieu de gamme suivants :
Sun Fire E6900 ;
Sun Fire E4900 ;
Sun Fire E6800 ;
Sun Fire E4810 ;
Sun Fire E4800 ;
Sun Fire E3800.
Ces informations concernent uniquement la reconfiguration dynamique exécutée sur les serveurs répertoriés dans cette section. Pour obtenir des informations sur la reconfiguration dynamique sur d'autres serveurs, reportez-vous aux notes de version ou aux notes de produit décrivant les serveurs correspondants.
Le Tableau 3–1 montre les combinaisons possibles du logiciel Solaris avec le microprogramme du CS (contrôleur système) pour chaque système Sun Fire milieu de gamme devant exécuter la reconfiguration dynamique.
Pour tirer le meilleur parti des dernières fonctionnalités du microprogramme et des corrections des bogues, exécutez le microprogramme CS le plus récent sur votre système Sun Fire milieu de gamme. Les dernières informations concernant les patchs sont disponibles sur le site http://sunsolve.sun.com.
Plate-forme |
Version de Solaris |
Microprogramme CS minimum |
---|---|---|
Sun Fire E6900/E4900 avec UltraSPARC IV+ |
Solaris 10 3/05 HW1 (une version limitée) ou Solaris 10 1/06 |
5.19.0 |
E6900/E4900 sans UltraSPARC IV+ |
Solaris 9 4/04 |
5.16.0 |
Sun Fire 6800/4810/4800/3800 |
Solaris 9 4/04 |
5.16.0 |
Sun Fire 6800/4810/4800/3800 |
Solaris 9 |
5.13.0 |
Vous pouvez mettre à niveau le microprogramme système pour votre système Sun Fire milieu de gamme en vous connectant au serveur FTP ou HTTP sur lequel les images du microprogramme sont stockées. Pour plus d'informations, consultez les fichiers README et Install.info. Ces fichiers sont inclus dans les versions du microprogramme exécutées sur les domaines. Vous pouvez télécharger des patchs Sun sur le site http://sunsolve.sun.com.
Cette section répertorie les bogues de reconfiguration dynamique importants.
Si un processus maintient ouvert un périphérique réseau, toute opération de reconfiguration dynamique impliquant ce périphérique échoue. Les démons et les processus qui conservent des comptes de référence empêchent l'exécution des opérations de reconfiguration dynamique.
Solution : en tant que superutilisateur, procédez comme suit :
Supprimez ou renommez le répertoire /rplboot.
Fermez les services NFS.
# sh /etc/init.d/nfs.server stop |
Fermez les services de serveur d'initialisation.
# sh /etc/init.d/boot.server stop |
Exécutez l'opération de reconfiguration dynamique de séparation.
Redémarrez les services NFS.
# sh /etc/init.d/nfs.server start |
Redémarrez les services de serveur d'initialisation.
# sh /etc/init.d/boot.server start |
Sur les systèmes Sun Fire milieu de gamme, il n'est pas possible d'annuler la configuration d'une carte E/S CompactPCI (cPCI) lorsque le port 0 (P0) de cette carte est désactivé. Ce problème existe dans le logiciel Solaris10 et Solaris 9. Il existe également dans le logiciel Solaris 8 sur lequel les patchs suivants sont installés :
Patch 108528–11 à 108528–29
Patch 111372–02 à 111372–04
En outre, ce problème se produit uniquement au cours d'opérations de reconfiguration dynamique impliquant des cartes cPCI. Un message similaire s'affiche :
# cfgadm -c unconfigure NO.IB7 cfgadm: Hardware specific failure: unconfigure N0.IB7: Device busy:/ssm@0,0/pci@1b,700000/pci@1 |
NO.IB7 est une carte E/S CompactPCI dont le port 0 (P0) est désactivé.
Solution : désactivez les emplacements des cartes à la place du port 0.
Cette section décrit les problèmes qui impliquent les fonctions suivantes sur le serveur Sun Enterprise 10000 :
Conditions relatives au SSP (System Service Processor)
Reconfiguration dynamique (DR)
IND (InterDomain Network)
Système d'exploitation Solaris sur les domaines Sun Enterprise 10000
Vous pouvez exécuter le logiciel Solaris10 sur des domaines particuliers au sein d'un système Sun Enterprise 10000. Cependant, Sun Enterprise 10000 System Service Processor n'est pas pris en charge par cette version.
Le logiciel SSP 3.5 est requis sur le SSP pour prendre en charge le logiciel Solaris10. Installez d'abord SSP 3.5 sur le SSP. Vous pouvez ensuite installer ou effectuer la mise à niveau vers le système d'exploitation Solaris10 sur un domaine Sun Enterprise 10000.
Le logiciel SSP 3.5 est également requis de manière à configurer correctement le domaine pour DR Model 3.0.
Cette section décrit les différents problèmes liés à la reconfiguration dynamique sur les domaines Sun Enterprise 10000.
Vous devez utiliser DR 3.0 sur les domaines Sun Enterprise 10000 fonctionnant avec le système d'exploitation Solaris version 9 12/03 et versions ultérieures. DR model 3.0 fait référence à la fonctionnalité qui utilise les commandes suivantes sur le SSP pour effectuer des opérations de reconfiguration dynamique sur les domaines :
addboard ;
moveboard ;
deleteboard ;
showdevices ;
rcfgadm.
Vous pouvez exécuter la commande cfgadm sur les domaines pour obtenir des informations sur l'état de la carte. DR model 3.0 communique également avec Reconfiguration Coordination Manager (RCM) pour coordonner les opérations de reconfiguration dynamique avec d'autres applications fonctionnant sur un domaine.
Pour des détails sur le modèle 3.0 de la reconfiguration dynamique, reportez-vous à la rubrique Sun Enterprise 10000 Dynamic Reconfiguration User Guide.
Pour cette version de Solaris, la reconfiguration dynamique ne délie plus automatiquement les processus utilisateur des CPU en cours de séparation. Vous devez exécuter cette opération avant d'initialiser une séquence de séparation. L'opération de vidange échoue si les CPU traitent des processus liés.
Si un processus maintient ouvert un périphérique réseau, toute opération de reconfiguration dynamique impliquant ce périphérique échoue. Les démons et les processus qui conservent des comptes de référence empêchent l'exécution des opérations de reconfiguration dynamique.
Solution : en tant que superutilisateur, procédez comme suit :
Supprimez ou renommez le répertoire /rplboot.
Fermez les services NFS.
# sh /etc/init.d/nfs.server stop |
Fermez les services de serveur d'initialisation.
# sh /etc/init.d/boot.server stop |
Exécutez l'opération de reconfiguration dynamique de séparation.
Redémarrez les services NFS.
# sh /etc/init.d/nfs.server start |
Redémarrez les services de serveur d'initialisation.
# sh /etc/init.d/boot.server start |
Pour qu'un domaine fasse partie d'un réseau interdomaine, toutes les cartes dont la mémoire est active dans ce domaine doivent être dotées d'au moins une CPU active.
Avant d'exécuter la commande boot net à partir de l'invite OpenBoot PROM (OK), vérifiez que la variable local-mac-address? a pour valeur false. Il s'agit du paramètre par défaut. Si la variable a la valeur true, vous devez vérifier que cette valeur est appropriée à la configuration locale.
Une variable local-mac-address? définie sur true peut empêcher l'initialisation du domaine sur le réseau.
La fenêtre netcon vous permet d'utiliser la commande suivante à l'invite OpenBoot PROM pour afficher les valeurs des variables OpenBoot PROM :
OK printenv |
Pour rétablir la valeur par défaut de la variable adresse-mac-locale?, utilisez la commande setenv :
OK setenv local-mac-address? false |
Cette section contient les dernières informations concernant la fonctionnalité de reconfiguration dynamique pour les serveurs milieu de gamme suivants exécutant le logiciel Solaris10 :
Sun Enterprise 6x00 ;
Sun Enterprise 5x00 ;
Sun Enterprise 4x00 ;
Sun Enterprise 3x00.
Pour plus d'informations sur la reconfiguration dynamique de Sun Enterprise Server, reportez-vous à la rubrique Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems. La version Solaris10 prend en charge les cartes mémoire/CPU et la plupart des cartes E/S dans les systèmes figurant dans la liste précédente.
Avant de continuer, assurez-vous que le système prend en charge la reconfiguration dynamique. Si votre système est ancien, le message suivant s'affiche sur votre console ou dans les journaux de votre console. Ce système n'est pas compatible avec la reconfiguration dynamique.
Hot Plug not supported in this system |
Les cartes E/S suivantes ne sont actuellement pas prises en charge :
type 2 (graphique) ;
type 3 (PCI) ;
type 5 (graphics and SOC+).
Cette section fournit des informations logicielles d'ordre général sur la reconfiguration dynamique.
Pour activer la reconfiguration dynamique, vous devez définir deux variables dans le fichier /etc/system. Vous devez également définir une variable supplémentaire pour activer la suppression des cartes mémoire/CPU. Procédez comme suit :
Connectez-vous en tant que superutilisateur.
Modifiez le fichier /etc/system en ajoutant les lignes suivantes :
set pln:pln_enable_detach_suspend=1 set soc:soc_enable_detach_suspend=1 |
Pour activer la suppression d'une carte mémoire/CPU, ajoutez cette ligne au fichier :
set kernel_cage_enable=1 |
La définition de cette variable active l'opération d'annulation de la configuration de la mémoire.
Réinitialisez le système pour appliquer les modifications.
Exécutez la commande suivante pour lancer le test de quiescence :
# cfgadm -x quiesce-test sysctr10:slot number |
Sur un système de grande taille, le test de quiescence peut durer une minute. Pendant la durée du test aucun messages n'est affiché si la commande cfgadm ne trouve aucun pilote non compatible.
Une tentative de connexion à une carte qui figure dans la liste des cartes désactivées peut produire un message d'erreur :
# cfgadm -c connect sysctrl0:slotnumber cfgadm: Hardware specific failure: connect failed: board is disabled: must override with [-f][-o enable-at-boot] |
Vous disposez de deux options pour annuler la condition désactivée :
utilisation de l'indicateur 'forcer' (-f) ;
# cfgadm -f -c connect sysctrl0:slot number |
Utilisation de l'option d'activation (-o enable-at-boot )
# cfgadm -o enable-at-boot -c connect sysctrl0:slot number |
Pour supprimer toutes les cartes dans la liste des cartes désactivées, choisissez l'une des deux options en fonction de l'invite à partir de laquelle vous exécutez la commande :
À partir de l'invite superutilisateur, tapez :
# eeprom disabled-board-list= |
À partir de l'invite OpenBoot PROM, tapez :
OK set-default disabled-board-list |
Pour plus d'informations sur le paramètre disabled-board-list, reportez-vous à la section sur les “variables NVRAM spécifiques” du manuel Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems. Ce manuel fait partie de la documentation utilisée dans cette version.
Des informations concernant le paramètre OpenBoot PROM disabled-memory-list sont disponibles dans cette version. Consultez la section “Specific NVRAM Variables” du manuel Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems dans la documentation Solaris concernant le matériel Sun.
Si vous devez décharger des pilotes mal séparés, utilisez la commande de ligne modinfo pour rechercher les ID de module des pilotes. Vous pouvez ensuite utiliser les ID de module dans la commande modunload pour décharger les pilotes mal séparés.
Retirez la carte du système le plus vite possible si le message d'erreur suivant s'affiche au cours d'une séquence de connexion de reconfiguration dynamique :
cfgadm: Hardware specific failure: connect failed: firmware operation error |
La carte est tombée en panne au cours du test automatique, par conséquent le retrait de la carte permet d'éviter les erreurs de reconfiguration possibles pouvant se produire lors de la prochaine initialisation.
L'état du test automatique indiquant un échec, il n'est pas possible d'effectuer d'autres opérations. Par conséquent, si vous voulez retenter immédiatement l'opération qui a échoué, vous devez d'abord retirer et réinsérer la carte.
La liste suivantes peut être modifiée à tout moment.
Si un processus maintient ouvert un périphérique réseau, toute opération de reconfiguration dynamique impliquant ce périphérique échoue. Les démons et les processus qui conservent des comptes de référence empêchent l'exécution des opérations de reconfiguration dynamique.
Solution : en tant que superutilisateur, procédez comme suit :
Supprimez ou renommez le répertoire /rplboot.
Fermez les services NFS.
# sh /etc/init.d/nfs.server stop |
Fermez les services de serveur d'initialisation.
# sh /etc/init.d/boot.server stop |
Exécutez l'opération de reconfiguration dynamique de séparation.
Redémarrez les services NFS.
# sh /etc/init.d/nfs.server start |
Redémarrez les services de serveur d'initialisation.
# sh /etc/init.d/boot.server start |
Si un processus de commande cfgadm est exécuté sur une carte, une tentative simultanée de déconnexion d'une seconde carte échoue. Le message d'erreur suivant s'affiche :
cfgadm: Hardware specific failure: disconnect failed: nexus error during detach:address |
Solution : exécutez une seule commande cfgadm à la fois. Permettez à l'opération cfgadm qui est exécutée sur une carte de se terminer avant de lancer une opération de déconnexion cfgadm sur une seconde carte.