C H A P I T R E  1

Notes de mise à jour de System Management Services (SMS) 1.4

Ce chapitre contient des notes de mise à jour relatives au logiciel System Management Services (SMS) 1.4 sur les systèmes haut de gamme Sun Fire et couvre les aspects suivants :


Limites connues de SMS 1.4

Cette section contient les limites connues qui concernent SMS sur un système haut de gamme Sun Fire :


Problèmes d'ordre général

Cette section traite des problèmes d'ordre général concernant le logiciel SMS installé sur les systèmes haut de gamme Sun Fire.

Diagnostic et reprise automatiques

Les fonctionnalités de diagnostic et de reprise automatiques suivantes sont activées par défaut dans SMS 1.4:

SMS 1.4 inclut trois moteurs de diagnostic (DE, diagnosis engine) qui analysent certaines erreurs du matériel et identifient les composants associés aux erreurs qui affectent la disponibilité du système et les domaines :

Le DE SMS diagnostique les erreurs du matériel associées à des arrêts de domaine (dstops).

Le DE de l'environnement d'exploitation Solaris (aussi appelé DE Solaris) identifie les erreurs non-bloquantes du matériel et les signale au contrôleur système.

Le DE POST identifie les tests de matériel ayant échoués survenus lors de
exécuté dans SMS pendant la mise sous tension.

Les DE enregistrent les informations de diagnostic pour les composants affectés et les conservent dans le cadre de l'état de santé du composant (CHS, component health status).

Les moteurs de diagnostic rapportent des informations de diagnostic au travers des canaux suivants :

Ces messages contiennent le numéro de série du châssis du système concerné et des codes d'événements qui identifient l'événement-panne ou erreur. Ces messages sont également enregistrés dans le journal d'événements de SMS, qui s'affiche en exécutant la commande showlogs.

Contactez votre chargé de maintenance quand vous voyez de tels messages. Ce dernier utilisera le numéro de série du châssis et le code de l'événement pour effectuer l'opération de maintenance appropriée.



Remarque - Dans certains cas, le moteur de diagnostic n'est pas en mesure d'attribuer un code d'événement raisonnable à cause de la diversité des composants associés à la panne en question. Dans de tels cas, le code de l'événement contiendra le mot UNKNOWN, par exemple SF15000-UNKNOWN. Contactez comme d'habitude votre chargé de maintenance pour effectuer l'opération de maintenance appropriée.



Vous pouvez configurer les fonctionnalités de signalisation via e-mail de sorte à être immédiatement averti des événements de type panne critiques, sans surveiller manuellement les journaux de la plate-forme ou des domaines. Comme avec les messages d'événements, contactez votre chargé de maintenance lorsque vous recevez ces e-mails pour que ce dernier puisse effectuer l'opération de maintenance appropriée.

En ce qui concerne les erreurs du matériel associées aux dstops, le POST examine les informations CHS des composants affectés et déconfigure les éventuels composants défectueux du système.

Pour de plus amples informations sur ces fonctionnalités, consultez le chapitre « Automatic Diagnosis and Recovery » dans le System Management Services (SMS) 1.4 Administrator Guide.

Nouvelles commandes SMS 1.4

Les nouveaux démons et commandes suivants sont relatifs aux fonctionnalités de diagnostic et de reprise introduites dans SMS 1.4. Pour des informations détaillées sur ces démons et commandes, reportez-vous à leurs descriptions dans le System Management Services (SMS) 1.3 Reference Manual.

/opt/SUNWSMS/SMS1.4/lib/smsadmin/testemail

Commandes SMS 1.4 révisées

Les commandes suivantes ont été mises à jour dans SMS 1.4 pour refléter les changements introduits par les fonctionnalités de diagnostic et de reprise automatiques. Pour des informations détaillées sur ces commandes, reportez-vous à leurs descriptions dans le System Management Services (SMS) 1.3 Reference Manual.

Numéro de série du châssis

Le numéro de série du châssis est utilisé pour identifier un système haut de gamme Sun Fire. Le numéro de série identifie la plate-forme dans les messages d'événements système et est utilisé par les chargés de maintenance pour mettre en relation les événements et les opérations de maintenance avec le système adéquat.

Le numéro de série du châssis est imprimé sur une étiquette sur le devant du châssis, au centre, près du bas. À partir de la version SMS 1.4, le numéro de série du châssis est automatiquement enregistré par Sun sur les systèmes qui sont livrés avec SMS 1.4 installé. Pour visualiser le numéro de série du châssis, exécutez la commande showplatform -p csn.

Si vous effectuez une mise à jour à SMS 1.4 à partir d'une version antérieure de SMS, utilisez la commande setcsn(1M) pour enregistrer le numéro de série du châssis de votre système haut de gamme Sun Fire. Pour de plus amples détails sur le numéro de série du châssis, reportez-vous au Guide d'installation de System Management Services (SMS) 1.4 et à la description de la commande setcsn dans le System Management Services (SMS) 1.3 Reference Manual.

Capacity On Demand (COD)

Vous pouvez temporairement activer un CPU immédiatement accessible (on parle aussi de « headroom ») pour remplacer un CPU non-COD défectueux. Dans ce cas, ce CPU immédiatement accessible sera considéré comme une pièce de rechange prête, c'est-à-dire un CPU de réserve pouvant être immédiatement utilisé pour remplacer un CPU non-COD défectueux. Cependant, une fois que vous aurez remplacé le CPU non-COD défectueux, vous devrez désactiver le CPU immédiatement accessible comme expliqué dans le chapitre « Capacity on Demand » du System Management Services (SMS) 1.4 Administrator Guide). Contactez votre représentant commercial ou votre revendeur Sun pour acheter une licence d'utilisation RTU COD pour le CPU immédiatement accessible utilisé si vous voulez continuer à l'utiliser.

Configuration des contrôleurs systèmes pour réseau externe

Chaque contrôleur système (SC) doit être configuré pour le réseau TCP/IP auquel il est associé. Reportez-vous au System Administration Guide: Resource Management and Network Services de la Collection Administrateur Système de Solaris 9 pour de plus amples informations sur l'organisation et la configuration d'un réseau TCP/IP. SMS prend en charge les configurations IPv4 et IPv6.

Dans cette version, le SC prend en charge les connexions réseau par le biais de prises jack RJ45 sur la face avant de chaque SC. Cela correspond aux interfaces réseau hme0 et eri1 sous le logiciel Solaris, pour chaque SC. Vous devrez configurer hme0 ou eri1sur chaque SC avec les données appropriées à votre réseau TCP/IP. En utilisant cette configuration, chaque SC sera identifié par les applications du réseau externe au moyen d'un nom d'hôte et d'une adresse IP propres.



caution icon

Précaution - Les adresses IP qui figurent dans les exemples de smsconfig dans la documentation des systèmes haut de gamme Sun Fire ne sont données qu'à titre d'exemple. Les adresses IP valides pour votre réseau sont indiquées dans le Sun Fire 15K/12K Systems Site Planning Guide. L'utilisation d'adresses IP non valides pour votre réseau peut, dans certains cas, empêcher la réinitialisation de votre système.



Chaque SC fonctionne dans un ou deux modes réciproquement exclusifs : SC principal ou SC de réserve. Le SC principal est celui qui contrôle la machine. Le SC de réserve est celui qui prend automatiquement le relais en cas de panne du SC principal. Il est important de savoir quel est le SC principal et quel est le SC de réserve. Pour cela, connectez-vous au SC et utilisez la commande suivante :

sc0:utilisateur-sms:> showfailover -r
MAIN

Si vous ne configurez pas le réseau externe, les applications basées sur ce réseau, telles que Sun Management Center, telnet et autres, doivent recevoir l'IP nom_d'hôte correcte du contrôleur système principal. En cas de basculement sur le second SC, ces applications doivent être redémarrées en utilisant l'adresse IP du nouveau SC principal.



Remarque - Toute modification apportée dans la configuration d'un SC en utilisant smsconfig -m doit être répercutée sur l'autre SC. La configuration du réseau ne se propage pas automatiquement.



Séquence BREAK du système

La séquence BREAK d'interruption du système a été changée afin de faciliter le basculement : STOP-A a été remplacé par [ENTREE] [TILDE] [CONTROL B].



Remarque - Toute la séquence doit être entrée en moins de 5 secondes en laissant un intervalle de plus de 0,5 seconde entre chaque caractère.



Cette nouvelle fonctionnalité a été introduite dans Solaris 8 pour permettre de forcer l'interruption du système à un moment quelconque, sans risquer les arrêts aléatoires non intentionnels. Ce risque existe pour les périphériques série utilisés comme consoles, mais pas pour les systèmes ayant leur propre clavier.

La ligne suivante du fichier /etc/default/kbd est par défaut sans commentaire :

KEYBOARD_ABORT=alternate



Remarque - Ne rétablissez pas l'utilisation de STOP-A sur le système, la fonctionnalité de reprise disparaîtrait.



Configuration IPSec

Les disques prévus pour être utilisés sur un Nom du produit doivent être installés en utilisant un système haut de gamme Sun Fire. L'instruction placée dans /etc/inet/inetd.conf doit également être ajoutée manuellement à /etc/inet/ipsecinit.conf.

Si une instruction est supprimée de /etc/inet/inetd.conf, elle doit également être éliminée manuellement de /etc/inet/ipsecinit.conf.

Voir bug n°4449848.

Commande smsconnectsc

smsconnectsc doit être utilisée si la commande login ne permet pas d'accéder normalement à un SC distant après son décrochement. L'utilisation smsconnectsc pour ouvrir une session sur la console distante à partir du SC local peut causer la perte du droit et de la fonctionnalité de surveillance. N'utilisez passmsconnectsc sauf pour une récupération du système.

Réinstallation et mise à jour

Les versions précédentes de SMS préconisaient l'utilisation de l'interface graphique utilisateur Javatrademark WebStart et de la commande pkgadd pour installer les packages de SMS sur le système haut de gamme Sun Fire. SMS 1.3 a introduit les scripts smsinstall et smsupgrade qui simplifient et rationalisent la procédure de mise à jour, à tel point que l'utilisation de WebStart et de pkgadd n'est plus recommandée, ni même documentée. Étant donné la complexité de configuration de SMS, ne tentez pas d'installer ni de mettre à jour SMS 1.4 en utilisant une méthode autre que celles décrites dans le Guide d'installation de System Management Services (SMS) 1.4. Vous risqueriez de ne pas configurer correctement SMS et de ne pas avoir accès à certaines fonctionnalités.


Notes sur la documentation de SMS

Cette section contient des notes sur la documentation relative à SMS sur un système Nom du produit.

Numéros de référence

Vous trouverez la documentation sur cette version du logiciel à l'adresse :

http://www.sun.com/products-n-solutions/hardware/docs/Servers/High-End_Servers/Sun_Fire_15K

Le nom de ces fichiers correspond au numéro de référence du document qu'ils contiennent. Pour faciliter votre recherche, voici les titres des documents contenus dans les fichiers :

817-4170-10.pdf - Guide d'installation de System Management Services (SMS) 1.4 (remplace le document 817-1342-10)

817-3056-10.pdf - System Management Services (SMS) 1.4 Administrator Guide (remplace le document 816-5318-10)

817-3057-10.pdf - System Management Services (SMS) 1.3 Reference Manual (remplace le document 816-5319-10)

817-3058-10.pdf - Notes de mise à jour de System Management Services (SMS) 1.4 (remplace le document 817-1347-10)

817-3075-10.pdf - Sun Fire High-End Systems Software Overview Guide (remplace le document 817-1352-10)

Documentation - Erratum

L'exemple 1 de la page de manuel testemail(1M) et la description de la commande dans le System Management Services (SMS) 1.3 Reference Manual ne contiennent pas le chemin complet de la commande testemail. La commande doit être spécifiée comme suit :

sc0:utilisateur-sms:> /opt/SUNWSMS/SMS1.4/lib/smsadmin/testemail -c fault.board.ex.l1l2, fault.board.io.l1l2 -dD -i EX7,IO8

Voir bug n°4934058.