C H A P I T R E 2 |
Bugs de SMS 1.4 |
Ce chapitre contient des informations sur les bugs connus de SMS 1.4. Il se compose comme suit :
Cette section résume les principaux bugs et RFE 1.4 qui affectent SMS 1.4. Il ne contient pas tous les bugs et RFE.
Interrompre la mise sous/hors tension au moyen de Contrôle-C peut causer un vidage d'image mémoire d'ESMD. ESMD redémarrera automatiquement et la reprise s'effectuera normalement. Les messages relatifs aux pannes de composants (esmd) et au redémarrage seront enregistrés dans le fichier de messages de la plate-forme.
Solution : N'utilisez pas Contrôle-C pendant les opérations de mise sous et hors tension.
Interrompre la mise sous/hors tension au moyen de Contrôle-C peut causer l'enregistrement d'erreurs telles que « client monitor failed » sur la plate-forme. Bien que ces messages ne reflètent pas des erreurs réelles et soient sans effet sur le système, ils peuvent alarmer inutilement.
Solution : Soit n'émettez pas de commandes Contrôle-C pendant les opérations de mise sous tension, soit, si vous en émettez, ignorez ces messages d'erreur.
Si vous essayez de changer CHS sur plusieurs composants avec une unique commande setchs, seul le premier de ces composants sera changé. La commande retourne « 0 » pour signaler la réussite de l'opération et ne fournit aucun message d'erreur indiquant que les composants suivants n'ont pas été changés.
Solution : La commande setchs -c est limitée à un composant à la fois.
Quand le contrôleur système est soumis à une charge importante, le logiciel SMS 1.4 peut rapporter des erreurs de temporisation de calibrage de la puce ADC telles que la suivante :
Solution : Ignorez ces messages d'erreur.
Quand esmd met hors tension un contrôleur système (SC) pour des raisons liées à l'environnement telles qu'une température élevée ou basse, un message trompeur s'affiche. Ce message indique que le SC va être mis hors tension et supprimé du domaine. Or, les contrôleurs système ne pouvant pas faire partie d'un domaine, ils ne peuvent pas en être supprimés.
Solution : Ignorez ce message.
Le temps nécessaire pour qu'un châssis Starcat se mette sous tension et que ses domaines affichent une invite Solaris a augmenté de près de 15%.
Le basculement risque de ne pas fonctionner correctement sur le SC de réserve quand un centerplane en mauvais état est utilisé.
Solution : Éliminez le problème du centerplane en mauvais état avant d'essayer de réparer le SC de réserve.
Quand les deux processeurs d'une carte système à deux processeurs sont mis en examen à cause d'erreurs corrigeables ECC Solaris et que le domaine est réinitialisé, le « Power State » de la carte système devient UNKNOWN au lieu de rester sur ON. Cela cause l'échec de showchs.
Ce problème ne survient pas avec les cartes système à quatre processeurs.
Solution : Soumettez la carte système à un cycle d'alimentation.
Si vous mettez hors tension une carte d'extension dans un domaine en cours d'exécution, dsmd n'assurera pas la reprise du domaine.
Solution : Ne mettez pas hors tension une carte d'extension quand les composants de l'emplacement 0 ou 1 sont utilisés par un domaine en cours d'exécution.
Il arrive qu'une opération d'ajout de carte réussie effectuée sur un domaine configuré dans une configuration à emplacement divisé affiche le message suivant :
FAIL Slot SB12: MaxCPU in use in Slot I012, allow_maxcpu_split_ex not set. There is no FRU service action indicated for this failure. |
Solution : Utilisez la commande showboards pour vérifier si l'opération a réussi. Si c'est le cas, ignorez le message.
Si vous exécutez des commandes setkeyswitch sur plusieurs domaines qui partagent des cartes d'extension, vous risquez de voir des messages d'erreur similaires au suivant :
L'opération ne se bloque pas. En fait, chacun des domaines verrouille le matériel partagé de son côté. Quand la première commande setkeyswitch se termine, les commandes setkeyswitch restantes peuvent commencer.
Si une carte système est insérée dans une carte d'extension mise hors tension, aucun enregistrement d'installation n'est écrit.
Solution : Retirez la carte système, mettez sous tension la carte d'extension et ré-insérez le carte système.
Cette section résume les bugs les plus importants susceptibles d'affecter le système SMS 1.4. Il ne s'agit toutefois pas d'une liste exhaustive de tous les bugs pouvant affecter le système SMS 1.4.
Si des domaines sont déjà installés et que vous changez la configuration du réseau MAN I1 en utilisant smsconfig -m, vous devrez configurer manuellement les informations du réseau MAN sur ces domaines installés.
Solution : Consultez les informations relatives aux domaines non-configurés du
Guide d'installation de System Management Services (SMS) 1.4.
La mise à jour 7 de l'environnement d'exploitation Solaris 8 n'inclut pas de prise en charge pour les cartes hsPCI+. Dans les domaines comportant uniquement des cartes hsPCI+, l'installation peut se bloquer après le démarrage des scripts Begin/Finish.
Solution : Appuyez sur Ctrl-C pour interrompre les scripts Begin/Finish. Cela permettra la poursuite de l'installation qui réussira.
Des dépassements de temporisation intermittents de I2C sont signalés par dxs et frad à la réception du statut d'une cassette Hpc3130 hsPCI. Les conséquences sont minimes et limitées à la consignation de messages d'erreur dans les fichiers journaux de la plate-forme, du domaine et de la console de domaine.
Si deux domaines partagent une extension et un pilote de périphérique (ou extension OS) sur un domaine, une adresse incorrecte est envoyée à l'espace E/S programmé et les deux domaines peuvent dstop. Cela se produit uniquement avec les extensions OS défectueuses qui s'exécutent en mode privilégié à l'instar des pilotes de périphériques.
Solution : Ne partagez en aucun cas une extension entre un domaine de production et un domaine contenant un logiciel en mode privilégié non testé ou problématique tel que les pilotes de périphériques.
Si une interruption de type arrêt de domaine (dstop) est détectée par hwad mais pas par dsmd, dsmd signalera une panne de pulsation. Seules les informations de configuration du matériel sont incluses dans le vidage d'image mémoire, et ni les données relatives aux registres du CPU ni celles relatives au domaine (dsmd.dump) ne sont enregistrées. Les fichiers de configuration du matériel rapportent une condition dstop.
Solution : Vous pouvez re-poster le domaine à un niveau supérieur pour révéler la source du problème matériel.
Si le contrôleur système d'un serveur haut de gamme ne peut pas résoudre son propre nom d'hôte, wcapp ne démarrera pas. Résultat, SMS ne démarrera pas non plus. À la place, vous verrez des messages d'erreur wcapp continus dans le journal de la plate-forme. Par exemple :
Solution : Assurez-vous que le nom exact de l'hôte du SC (tel que retourné par la commande hostname(1)) et l'adresse IP exacte sont enregistrés dans le fichier /etc/hosts ou le service de noms utilisé quel qu'il soit. Une manière d'enregistrer le nom dans le fichier /etc/hosts consiste à exécuter de nouveau la commande smsconfig et à entrer le nom d'hôte et l'adresse IP qui avaient été utilisés pour le SC dans le Site Planning Guide. Une fois que vous avez vérifié l'exactitude du nom de l'hôte et de l'adresse IP, redémarrez SMS.
Cette section résume les erreurs qui figurent dans les pages et de manuel et la documentation relatives à SMS 1.4.
L'exemple de mise à jour de la page de manuel smsupgrade.1m n'affiche pas les bons suffixes de mise à jour pour les packages de SMS. Tous les packages mis à jour doivent présenter le suffixe .2.
Solution : Lisez à la place le Guide d'installation de SMS 1.4.
Les descripteurs des données de la plate-forme de la page de manuel pcd.1m et du SMS 1.4 Reference Manual ne sont pas corrects. Pour SMS 1.4, les descripteurs sont de la version 3, et un champ « Chassis Serial Number » (Numéro de série du châssis) a été ajouté aux informations de la plate-forme.
Le Guide d'installation de SMS 1.4 ne signale pas que deux fichiers flashupdate, nSCCPOST.di et oSCCPOST.di, peuvent seulement être utilisés sur certaines types de contrôleurs système (SC). Chacun de ces fichiers correspond à un matériel bien défini :
En plus, les exemples des pages 23, 38, 52 et 61 montrent une carte CP1500 sur un SC et une carte CP2140 sur l'autre SC, ce qui n'est pas pris en charge.
Solution : Pour connaître le type de votre SC, contrôlez le fichier journal des messages de la plate-forme au démarrage de SMS.
La commande showboards -c, conçue pour afficher la source d'horloge pour toutes les cartes système, indique par erreur que toutes les cartes WPCI du système sont désactivées. Ce statut incorrect ne s'affiche qu'avec l'option -c.
Solution : Ignorez le statut des cartes WPCI ou exécutez de nouveau la commande showboards sans l'option -c pour vérifier le statut des cartes.
Copyright © 2004, Sun Microsystems, Inc. Tous droits réservés.