C H A P I T R E  3

Préparation à l'utilisation du logiciel DR

Ce chapitre, conjointement aux chapitres 1 et 2, fournit des informations et certaines procédures nécessaires à l'utilisation de DR.



caution icon

Attention - Toute opération DR exécutée de manière incorrecte peut provoquer l'échec de DR et, dans certains cas, endommager des composants système.



Ce chapitre comprend les sections suivantes :


Commande cfgadm(1M)

La commande cfgadm(1M) effectue des opérations DR sur le domaine. Ces opérations sont envoyées à l'interface de bibliothèque (3LIB) libcfgadm qui charge de manière dynamique un plug-in de bibliothèque spécifique au matériel. C'est se dernier qui effectue les opérations DR.



Remarque - Si la commande cfgadm(1M) échoue pendant une opération DR, la carte ne revient pas à son état d'origine. Si l'erreur est récupérable, exécutez de nouveau la commande. Dans le cas contraire, vous devez redémarrer le domaine pour utiliser la carte.



Le plug-in spécifique au matériel sbd.so.1 fournit les fonctions DR suivantes : connect, configure, unconfigure et disconnect (connecter, configurer, déconfigurer et déconnecter), ce qui vous permet de connecter ou de déconnecter une carte système d'un système en cours d'exécution sans avoir à redémarrer ce dernier.

La commande cfgadm(1M) se trouve dans le répertoire /usr/sbin. (Pour de plus amples informations, reportez-vous à la page man cfgadm(1M)).

Chaque emplacement de carte apparaît comme un point d'attache unique dans l'arborescence des périphériques. Utilisez la commande cfgadm(1M) avec l'option -a pour afficher le type, l'état et la condition de chaque composant, ainsi que l'état et la condition de chaque emplacement de carte.

Les options et opérandes suivants sont pris en charge dans le cadre des fonctions indiquées, où ap_id spécifie le point d'attache d'une carte système ou d'un composant :


TABLEAU 3-1 Options de la commande cfgadm

Options et opérandes

Action

-c connect ap_id

Définit l'état du réceptacle sur connected (connecté).

-c disconnect ap_id

Définit l'état du réceptacle sur disconnected (déconnecté).

-c configure ap_id

Définit l'état de l'occupant sur configured (configuré).

-c unconfigure ap_id

Définit l'état de l'occupant sur unconfigured (déconfiguré).

-x assign ap_id

Définit l'état de l'occupant sur assigned (assigné).

-x unassign ap_id

Définit l'état de l'occupant sur unassigned (non assigné).

-x poweron ap_id

Définit l'état de l'occupant sur powered on (sous tension).

-x poweroff ap_id

Définit l'état de l'occupant sur powered off (hors tension).

-l ap_id

Affiche l'état et la condition des cartes système et des composants.

-h [ap_id]

Imprime un message d'aide. Si ap_id est spécifié, la routine d'aide de la bibliothèque spécifique au matériel correspondant au point d'attache indiqué par l'argument est appelée.

-v

Exécute la commande en mode verbose.

-n

Répond automatiquement Non à toutes les invites sans les afficher.

-y

Répond automatiquement Oui à toutes les invites sans les afficher.

-s options_liste

État des points d'attache à afficher en fonction de l'argument options_liste. Fournit les options de liste à l'indicateur -l. L'argument options_liste respecte les conventions de syntaxe de la page man getsubopt(3C) et spécifie les éléments suivants :

  • critères de sélection des points d'attache (select=select_string, par exemple) ;
  • type de résultat souhaité (match=match_type, par exemple) ;
  • ordre de la liste (sort=field_spec, par exemple) ;
  • données affichées (cols=field_spec et cols2=field_spec, par exemple) ;
  • séparateur de colonnes (delim=string, par exemple) ;
  • suppression des en-têtes de colonne (noheadings, par exemple).

-o options_matériel

Fournit les options spécifiques au matériel à l'option de commande principale. Le format et le contenu de la chaîne options_matériel dépendent entièrement du matériel. La chaîne respecte les conventions de syntaxe de la page man getsubopt(3C).

-t ap_id

Effectue un test sur un ou plusieurs points d'attache. La fonction test est utilisée pour réévaluer la condition du point d'attache. Si vous ne spécifiez pas le niveau de test dans la chaîne options_matériel, le test identifiant le plus rapidement les incidents permanents est utilisé.


 


Commande rcfgadm(1M) (systèmes haut de gamme uniquement)

La commande SMS rcfgadm(1M) exécutée sur le SC dispose des mêmes options et opérandes que la commande cfgadm(1M), mais requiert souvent l'ajout de l'option -d id_domaine. Reportez-vous à la section rcfgadm(1M).


Vérification du type, de l'état et de la condition

Avant de vous lancer dans une opération DR qu'elle soit sur une carte ou un composant de domaine, vous devez en déterminer l'état et la condition.


procedure icon  Pour afficher l'état, le type et la condition

single-step bulletUtilisez la commande cfgadm(1M) et les options -la.


# cfgadm -la

 

procedure icon  Pour afficher des informations sur les emplacements et les composants de carte

single-step bulletUtilisez la commande prtdiag(1M).


# prtdiag 

 

La commande prtdiag(1M) affiche les numéros de carte.


Préparation à l'utilisation du logiciel DR sur un domaine

Avant d'effectuer pour la première fois des opérations DR sur un domaine qui vient de démarrer, assurez-vous que la carte est disponible pour le domaine.


procedure icon  Pour afficher les cartes disponibles d'un domaine

single-step bulletUtilisez la commande cfgadm(1M) et l'option -l.


# cfgadm -l

 

Chaque domaine d'un système haut de gamme conserve une liste des composants disponibles. Les domaines de systèmes milieu de gamme conservent des listes de contrôle d'accès. Ces deux types de listes s'intitulent ACL.

Une erreur peut survenir si vous essayez d'effectuer des opérations DR sur une carte présentant l'une des caractéristiques suivantes :

Dans les deux cas, la carte n'est pas disponible pour le domaine. Pour de plus amples informations sur l'affichage de la liste de composants disponibles (ACL) sur les systèmes haut de gamme, reportez-vous au manuel System Management Services (SMS) Administrator Guide. Pour de plus amples informations sur les ACL d'un système milieu de gamme, reportez-vous au manuel Guide d'administration de plate-forme pour systèmes de milieu de gamme Sun Fire.


Affichage de l'état d'une carte système


procedure icon  Pour afficher l'état d'une carte système

single-step bulletUtilisez la commande cfgadm(1M).


# cfgadm -a -s "select=class(sbd)"

 

La commande cfgadm(1M) affiche des informations uniquement sur les cartes assignées au domaine, ou qui ne sont pas assignées à un autre domaine et figurent dans l'ACL. L'option -a indique à la commande de répertorier tous les points d'attache connus, y compris les emplacements de carte, les bus SCSI et les emplacements PCI.

Le tableau suivant montre une sortie type sur un domaine de système milieu de gamme.


TABLEAU 3-2 Exemple d'affichage de l'état d'une carte système

Ap_Id

Type

Réceptacle

Occupant

Condition

N0.IB6
PCI_I/O_Boa
connected
configured
ok
N0.IB7
PCI_I/O_Boa
connected
configured
ok
N0.IB8
PCI_I/O_Boa
connected
configured
ok
N0.IB9
PCI_I/O_Boa
disconnected
unconfigured
unknown
N0.SB0
CPU_Board
connected
configured
unknown
N0.SB1
CPU_Board
disconnected
unconfigured
failed
N0.SB2
CPU_Board
connected
configured
ok
N0.SB3
unknown
empty
unconfigured
unknown
N0.SB4
unknown
empty
unconfigured
unknown
N0.SB5
unknown
empty
unconfigured
unknown

 

Pour afficher davantage d'informations, ajoutez l'option -v à la commande cfgadm(1M).


Test d'une carte


procedure icon  Pour tester une carte système

single-step bulletUtilisez la commande cfgadm(1M) et l'option -t.


# cfgadm -t ap_id

 

ap_id correspond à l'identificateur de point d'attache.

single-step bulletUtilisez la commande cfgadm(1M) et les options -t et -o pour effectuer le test à un niveau de diagnostic spécifique (systèmes milieu de gamme uniquement).


# cfgadm -o platform=diag=<niveau> -t ap_id

 

niveau désigne le niveau de diagnostic et ap_id correspond à l'identificateur de point d'attache.

Si vous ne précisez pas de niveau sur les systèmes milieu de gamme, le niveau de diagnostic par défaut est défini par la commande setupdomain, comme indiqué dans les manuels Guide d'administration de plate-forme pour systèmes de milieu de gamme Sun Fire et Sun Fire Midrange System Controller Command Reference Manual. Les niveaux de diagnostic sont les suivants :


TABLEAU 3-3 Niveaux de diagnostic

Niveau de diagnostic

Description

init

Exécute, mais ne teste pas, le code d'initialisation de la carte système pour un passage rapide par le POST.

quick

Teste tous les composants de la carte système (quelques tests et modèles de tests uniquement).

default ou max

Effectue tous les tests, selon tous les modèles de tests, sur l'intégralité des composants de la carte système, excepté les modules de mémoire et Ecache.

mem1

Exécute tous les tests du niveau default, ainsi que des algorithmes de test DRAM et SRAM complets. Teste tous les emplacement (modules de mémoire et Ecache) selon plusieurs modèles. Certains algorithmes plus complets, mais particulièrement longs, ne sont pas exécutés à ce niveau.

mem2

Identique à mem1. Exécute en outre un test de la DRAM, qui effectue des opérations de comparaison explicites sur les données de la DRAM.


 

procedure icon  Pour tester une carte d'E/S (systèmes milieu de gamme uniquement)



Remarque - Vous ne pouvez pas faire appel aux opérations de connexion et configuration de reconfiguration dynamique (DR) en vue d'ajouter une carte d'E/S à un domaine au sein d'un système de milieu de gamme à partition unique configuré avec une ou plusieurs cartes système UltraSPARC IV+. Cette restriction s'explique par l'absence d'un second domaine dan lequel la carte d'E/S pourrait être testée. Vous pouvez néanmoins utiliser la déconfiguration DR et déconnecter les commandes sur une carte d'E/S dans le système décrit. Pour plus d'informations, reportez-vous au Guide d'administration de plate-forme pour systèmes de milieu de gamme Sun Fire pour le microprogramme version 5.19.0.



Dans cette procédure, le domaine A constitue le domaine courant actif et le domaine B représente le domaine spare.

1. Entrez le shell du domaine spare (B).

2. Appuyez sur la touche CTRL et maintenez-la enfoncée tout en appuyant sur la touche ] pour afficher l'invite telnet>.

3. Lorsque l'invite telnet> apparaît, tapez send break pour afficher le shell de domaine du contrôleur système.

4. Dans le shell du domaine spare (B), ajoutez le bloc d'E/S au domaine.


nomhôteSC:B> addboard IBx

 

x est 6, 7, 8 ou 9.

5. Mettez l'interrupteur à clé virtuel du domaine spare sur Marche (on).


nomhôteSC:B> setkeyswitch on
.
.
{x} ok

 

x correspond au CPU. Le POST est exécuté sur le domaine lorsque vous mettez l'interrupteur à clé virtuel sur Marche. Si l'invite ok s'affiche, ceci signifie que la carte d'E/S ou le bloc d'E/S fonctionne correctement.

6. Définissez le mode sur standby.


nomhôteSC:B> setkeyswitch standby

 

7. Supprimez la carte.


nomhôteSC:B> deleteboard ibx

 

8. Ajoutez la carte au domaine actif (A).


# cfgadm -c configure N0.IBx

 

procedure icon  Pour préparer une carte d'E/S à une opération DR (systèmes haut de gamme uniquement)

Avant d'effectuer une opération DR sur une carte d'E/S d'un domaine de système haut de gamme, vérifiez que les déclarations suivantes sont vraies :

Pour de plus amples informations sur les processus de liaison, reportez-vous à la page man pbind(1M).

Lorsque vous utilisez DR pour configurer une carte d'E/S sur un domaine (ou pour tester une carte d'E/S de manière explicite à l'aide de la commande cfgadm(1M) et de l'option -t), un CPU, occupant d'une carte système sur le même domaine, est sélectionné pour tester cette carte. En outre, aucun processus ne peut être lié au CPU et au moins un CPU supplémentaire doit demeurer sur le domaine. Quand un tel CPU n'est pas disponible pour effectuer le test, un message, similaire au suivant, s'affiche :


WARNING: No CPU available for I/O cage test

 

Le CPU est déconfiguré du domaine et la carte d'E/S est testée. Une fois le test terminé, le CPU est de nouveau configuré sur le domaine. Après la reconfiguration du CPU, la date et l'heure affichées par la commande psrinfo(1M) diffèrent de celles des autres CPU sur le domaine.