Notes sur les plates-formes : stations de travail Sun Ultra 450 et serveurs Ultra Enterprise 450

Chapitre 2 Paramètres de configuration système

Ce chapitre décrit les variables de configuration NVRAM et les commandes OpenBoot PROM (OBP) permettant de configurer les aspects suivants du comportement d'un système Ultra 450 :

Les variables de configuration NVRAM examinées dans ce chapitre sont les suivantes:

Les commandes OBP examinées dans ce chapitre sont les suivantes:

Sondage UPA

Les systèmes Ultra 450, comme tous les systèmes basés sur UltraSPARC(TM), reposent sur le bus d'architecture de port Ultra (UPA, Ultra Port Architecture) rapide, un bus système commuté qui fournit jusqu'à 32 adresses d'identification de port (ou emplacements) pour les périphériques à carte mère haut débit tels que les unités centrales (UC), ponts E/S et mémoires d'écran (frame buffers). Alors que la plupart des systèmes Ultra n'emploient que trois ou quatre ports UPA actifs, les systèmes Ultra 450 fournissent jusqu'à neuf ports actifs répartis entre les sous-systèmes suivants.

Tableau 2-1 Ports en fonctionnement

Type de périphérique 

Emplacement UPA 

Mise en uvre physique 

UC 

0-3 

Quatre emplacements enfichables 

Pont UPA-PCI 

4,6,1f 

Soudé sur la carte mère 

Carte graphique UPA 

1d, 1e  

Deux emplacements enfichables 

L'ordre de sondage de ces neuf ports ID n'est pas contrôlé par l'utilisateur, toutefois on peut exclure une liste de ports au moyen de la variable NVRAM upa-port-skip-list. Dans l'exemple suivant, cette variable est utilisée pour exclure du sondage l'un des ponts UPA-PCI et la première carte graphique UPA de la liste de sondage UPA.


ok setenv upa-port-skip-list 4,1d

Cette fonctionnalité vous permet d'exclure un périphérique (qui ne sera donc pas utilisé) donné du sondage effectué par le système sans retirer physiquement la carte enfichable. Elle est pratique pour isoler une carte défectueuse dans un système présentant des pannes temporaires.

Sondage PCI

Sur les six bus PCI d'un système Ultra 450, le bus 0 (/pci@1f,4000 dans l'arborescence des périphériques) est unique dans la mesure où il est le seul bus PCI qui contient des périphériques (non enfichables) de la carte mère tels que des contrôleurs standard Ethernet et SCSI. Par définition, ces périphériques ne peuvent être ni retirés ni échangés pour modifier l'ordre dans lequel ils sont sondés. Pour contrôler le sondage de ces périphériques, le système fournit la variable NVRAM pci0-probe-list. Cette variable contrôle à la fois l'ordre de sondage et l'exclusion de périphériques sur le bus PCI 0. Les valeurs de la liste pci0-probe-list sont définies dans le tableau suivant.

Tableau 2-2 Valeurs dans la liste de sondage pci0-probe-list

Numéro de périphérique PCI 

Fonction 

0

Pont bus UPA-PCI (pas sondé) 

1

 Interface EBus/Ethernet (toujours sondée, ne figure jamais dans la liste de sondage)

2

Carte contrôleur SCSI intégrée pour périphériques média amovibles et port SCSI externe 

3

Carte contrôleur SCSI intégrée pour fond de panier UltraSCSI à quatre emplacements 

4

Emplacement PCI 10 du panneau arrière 


Remarque :

Les valeurs figurant dans cette liste se basent sur les numéros de périphérique PCI et ne font -pas référence à la numérotation de 1 à 10 des emplacements du panneau arrière.


Dans l'exemple suivant, la variable pci0-probe-list est utilisée pour définir un ordre de sondage de 3 à 4, tout en excluant de la liste de sondage la carte contrôleur SCSI intégrée destinée aux périphériques média amovibles et au port SCSI externe


ok setenv pci0-probe-list 3,4

L'ordre de sondage des cinq autres bus PCI (emplacements PCI 1 à 9) n'est pas contrôlé par l'utilisateur. Ces emplacements sont toujours sondés dans l'ordre suivant: 5-3-2-1-4-9-8-7-6. Il est toutefois possible d'exclure une liste d'emplacements PCI du sondage au moyen de la variable NVRAM pci-slot-skip-list. Dans l'exemple qui suit, cette variable est utilisée pour exclure les emplacements 3 et 8 du panneau arrière de la liste de sondage PCI


ok setenv pci-slot-skip-list 3,8


Remarque :

Les valeurs figurant dans pci-slot-skip-list correspondent à la numérotation de 1 à 10 des emplacements du panneau arrière. Si l'emplacement 10 figure dans cette liste, il sera exclu du sondage même si le numéro de périphérique 4 (emplacement 10 du panneau arrière) figure dans pci0-probe-list


Entrelacement de mémoire

Dans les systèmes Ultra 450, l'entrelacement de mémoire est contrôlé par la variable NVRAM memory-interleave. Vous trouverez dans le tableau ci-dessous les différents paramétrages de cette variable et leurs effets sur la configuration de la mémoire. D'autres informations sur l'entrelacement et la configuration de la mémoire figurent dans la section "A propos de la mémoire" du guide du propriétaire fourni avec les systèmes Ultra 450.

Tableau 2-3 Paramétrage de la variable memory-interleave

Paramétrage 

Effet sur la configuration de la mémoire 

auto (valeur par défaut)

Active l'entrelacement de niveau quatre si les quatre blocs de mémoire contiennent des DIMM de même capacité. Active l'entrelacement de niveau deux si seuls les blocs A et B sont tous deux utilisés et qu'ils contiennent des DIMM de même capacité. Sinon, l'entrelacement est désactivé. 

max-size

Même chose que le paramétrage auto pour les systèmes Ultra 450.

max-interleave

Active le plus haut niveau d'entrelacement possible pour une configuration de mémoire donnée, mais une partie de la mémoire reste inutilisée si les DIMM installés sont de capacités différentes. Au sein de chaque DIMM, utilise un volume de mémoire égal à la capacité du plus faible DIMM installé. 

1

Désactive l'entrelacement; utilise toute la mémoire disponible. 

2

Force l'entrelacement de niveau deux entre les blocs A et B. Une partie de la mémoire reste inutilisée si les DIMM installés sont de capacités différentes. Le DIMM ayant la plus faible capacité doit être installé dans le bloc B. Les blocs C et D, s'ils sont garnis, restent inutilisés. 

4

Force l'entrelacement de niveau quatre entre les quatre blocs. Une partie de la mémoire reste inutilisée si les DIMM installés sont de capacités différentes. Le DIMM ayant la plus faible capacité doit être installé dans le bloc D. 

L'exemple suivant montre comment configurer le système pour maximiser l'entrelacement de mémoire.


ok setenv memory-interleave max-interleave

Surveillance et contrôle de l'environnement

Les fonctionnalités de surveillance et de contrôle de l'environnement des systèmes Ultra 450 se répartissent entre le niveau système d'exploitation et le niveau micro-programmes OBP. Cette répartition garantit la bonne marche des fonctionnalités de surveillance même en cas de panne ou d'impossibilité d'initialiser le système. La façon dont OBP surveille et réagit à des conditions de surchauffe de l'environnement est contrôlée par la variable NVRAM env-monitor. Le tableau suivant répertorie les différents paramétrages de cette variable et leurs effets sur le comportement OBP. Pour de plus amples informations sur les fonctionnalités de surveillance de l'environnement, reportez-vous à la section "A propos de la fiabilité, de la disponibilité et de la facilité d'entretien du système" du guide du propriétaire fourni avec votre système Ultra 450.

Tableau 2-4 Paramétrage de la variable env-monitor

Paramétrage 

Surveillance activée? 

Action entreprise 

enabled (valeur par défaut)

Oui 

En cas de surchauffe ou de panne du ventilateur de l'unité centrale ou de celui du support des unités de disque, OBP émet un avertissement et arrête automatiquement le système au bout de 30 secondes. 

advise

Oui 

OBP se contente d'émettre un avertissement sans arrêter le système. 

disabled

Non  

OBP ne fait rien; la surveillance de l'environnement au niveau OBP est désactivée. 

Dans l'exemple qui suit, la variable env-monitor est utilisée pour désactiver la surveillance de l'environnement au niveau OBP


ok setenv env-monitor disabled


Remarque :

Cette variable NVRAM n'influe pas sur les fonctionnalités de surveillance et de contrôle de l'environnement d'un système d'exploitation en cours de fonctionnement.


Reprise automatique du système

La fonctionnalité de reprise automatique du système (ASR, Automatic System Recovery) permet à un système Ultra 450 de recommencer à fonctionner après certaines pannes ou défaillances matérielles. Les diagnostics Power-on self-test (POST) et OpenBoot (OBDiag) peuvent automatiquement détecter des composants matériels défectueux, tandis qu'une fonction d'auto-configuration conçue dans le micro-programme OBP permet au système de déconfigurer les composants défectueux et de se remettre à fonctionner. Tant que le système est en mesure de fonctionner sans le composant défectueux, les fonctionnalités ASR permettent au système de se réinitialiser automatiquement sans l'intervention de l'opérateur. Cette "initialisation dégradée" permet au système de continuer à fonctionner jusqu'à ce que vous appeliez le service après-vente pour remplacer la pièce défectueuse.

Si un composant défectueux est détecté pendant la séquence de mise sous tension, il est déconfiguré et, si le système peut continuer à fonctionner sans, la séquence d'initialisation se poursuit. Dans un système en fonctionnement, certains types de pannes (par exemple une panne de processeur) peuvent entraîner une réinitialisation automatique du système. Si cela se produit, la fonctionnalité ASR permet au système de se réinitialiser immédiatement du moment qu'il est en mesure de fonctionner sans le composant défectueux. Cela évite qu'un simple composant matériel défectueux n'empêche le système de fonctionner ou ne le bloque de nouveau.

Déconfiguration "douce" au moyen de la propriété d'état

Pour supporter une fonctionnalité d'initialisation dégradée, l'OBP utilise l'interface client 1275 (via l'arborescence des périphériques) pour "marquer" les périphériques qui sont soit défectueux soit désactivés, en créant une propriété d'"état" appropriée dans le nud correspondant de l'arborescence des périphériques. Par convention, UNIX n'activera pas de gestionnaire pour les sous-systèmes marqués de la sorte.

Par conséquent, tant que le composant défectueux est dormant électriquement parlant (c'est-à-dire tant qu'il n'est pas à l'origine d'erreurs de bus aléatoires, de sonneries, etc.), le système peut être réinitialisé automatiquement et reprendre son fonctionnement en attendant que vous appeliez le service après-vente.

Déconfiguration "forte"

Il existe deux cas de déconfiguration d'un sous-système (UC et mémoire), où l'OBP va au-delà de la simple création d'une propriété d'état appropriée dans l'arborescence des périphériques. Dans les instants qui suivent la réinitialisation, l'OBP doit initialiser et configurer du point de vue fonctionnel (ou ignorer) ces fonctions pour que le reste du système fonctionne correctement. Les actions entreprises dans ces deux cas de figure le sont sur la base de l'état de deux variables de configuration NVRAM, post-status et asr-status, qui contiennent les informations de neutralisation fournies par le POST ou via une neutralisation manuelle effectuée par l'utilisateur (reportez-vous à la section "Fonctionnalité de neutralisation de l'utilisateur (ASR)").

Déconfiguration de l'unité centrale

Si une UC est marquée comme ayant échoué au POST ou si un utilisateur choisit de désactiver une UC, l'OBP définira le bit Master Disable de l'UC concernée, ce qui revient en fait à la désactiver comme un périphérique UPA actif jusqu'à la réinitialisation du système lors de la prochaine mise sous tension.

Déconfiguration de la mémoire

Détecter et isoler un problème de mémoire système est l'une des tâches de diagnostic les plus ardues. De plus, le problème est compliqué par les différents modes d'entrelacement de la mémoire système et par le fait que les DIMM d'un bloc donné peuvent ne pas être identiques.

Ainsi, en cas de défaut d'un composant de mémoire, le micro-programme déconfigurera l'ensemble du bloc associé à la panne. Cela signifie que la configuration dégradée pourra être synonyme de facteur d'entrelacement plus bas, d'utilisation inférieure à cent pour cent des blocs restant ou de ces deux possibilités réunies selon le facteur d'entrelacement.

Fonctionnalité de neutralisation de l'utilisateur (ASR)

Bien que dans la plupart des cas les paramètres par défaut pourvoient correctement à la configuration ou à la déconfiguration d'un système Ultra 450, il est conseillé de fournir aux utilisateurs avancés une fonctionnalité de neutralisation manuelle. A cause de la nature différente des déconfigurations "douce" et "forte", deux mécanismes de neutralisation différents sont nécessaires.

Neutralisation de la déconfiguration "douce"

Les utilisateurs peuvent, pour tout sous-système représenté par un nud distinct de l'arborescence des périphériques, désactiver cette fonction au moyen de la variable NVRAM asr-disable-list, qui n'est autre qu'une liste des chemins de l'arborescence des périphériques séparés par des espaces.


ok setenv asr-disable-list /pci/ebus/ecpp /pci@1f,4000/scsi@3

L'OBP de l'Ultra 450 utilisera ces informations pour créer des propriétés d'état désactivé pour chacun des nuds figurant dans la variable asr-disable-list.

Neutralisation de la déconfiguration "forte"

Pour ignorer les sous-systèmes qui nécessitent une déconfiguration "forte" (UC et mémoire), les commandes OBP asr-enable et asr-disable sont utilisées pour activer ou désactiver de manière sélective chaque sous-système.


Remarque :

Les neutralisations douce et forte peuvent faire double emploi. Dans la mesure du possible, utilisez de préférence les commandes de neutralisation forte asr-enable et asr-disable


Pour garder trace de l'état de toutes les neutralisations manuelles, une nouvelle commande utilisateur, .asr, est fournie pour résumer les paramètres courants.


ok asr-disable cpu1 bank3
ok .asr
CPU0:	Enabled	
CPU1:	Disabled	
CPU2:	Enabled	
CPU3:	Enabled	
SC-Marvin:	Enabled	
Psycho@1f:	Enabled	
Psycho@4:	Enabled	
Psycho@6:	Enabled	
Cheerio:	Enabled	
SCSI:	Enabled	
Mem Bank0:	Enabled	
Mem Bank1:	Enabled	
Mem Bank2:	Enabled	
Mem Bank3:	Disabled	
PROM:	Enabled	
NVRAM:	Enabled	
TTY:	Enabled	
Audio:	Enabled	
SuperIO:	Enabled	
PCI Slots:	Enabled	

Options d'initialisation automatique

OpenBoot prévoit un commutateur contrôlé par la NVRAM appelé auto-boot?, qui contrôle si OBP doit initialiser automatiquement le système d'exploitation après chaque réinitialisation. Le paramétrage par défaut pour les plates-formes Sun est true.

En cas d'échec des diagnostics à la mise sous tension d'un système, auto-boot? est ignoré et le système n'est pas initialisé à moins que l'utilisateur ne le fasse manuellement. Ce comportement ne pouvant certes pas être accepté en cas d'initialisation dégradée, l'OBP de l'Ultra 450 fournit un second commutateur OBP contrôlé par la NVRAM appelé -auto-boot-on-error?. Ce commutateur contrôle si le système tentera une initialisation dégradée en cas de détection d'un sous-système défectueux. Les deux commutateurs auto-boot? et auto-boot-on-error? doivent être mis sur true pour permettre une initialisation dégradée.


ok setenv auto-boot-on-error? true


Remarque :

Le paramétrage par défaut de auto-boot-on-error? est false. Par conséquent, le système ne tentera pas d'initialisation dégradée tant que vous ne mettrez pas ce paramètre sur true. De même, le système ne tentera pas d'initialisation dégradée en réponse à une erreur bloquante irrémédiable, même si l'initialisation dégradée est activée. Un exemple d'erreur bloquante irrémédiable est la désactivation de toutes les UC d'un système, que ce soit suite à l'échec du POST ou à une neutralisation manuelle effectuée par l'utilisateur.


Scénarios de réinitialisation

Le protocole de réinitialisation système standard ignore complètement les diagnostics des micro-programmes sauf si la variable NVRAM diag-switch? est sur true. Le paramétrage par défaut de cette variable est false.

Pour supporter l'ASR dans un système Ultra 450, il est préférable de pouvoir exécuter les diagnostics des micro-programmes (POST/OBDiag) lors de tout événement de réinitialisation. Plutôt que de simplement changer le paramètre par défaut de diag-switch? pour le mettre sur true, qui implique d'autres effets secondaires (reportez-vous à l'OpenBoot 3.x Command Reference Manual), l'OBP de l'Ultra 450 prévoit une nouvelle variable NVRAM appelée diag-trigger qui permet de choisir quels événements de réinitialisation, le cas échéant, déclencheront automatiquement POST/OBDiag. La variable diag-trigger et ses différents paramétrages sont décrits dans le tableau suivant.


Remarque :

diag-trigger n'a aucun effet sauf si diag-switch? est mis sur true.


Tableau 2-5 Paramétrage de power-reset, error-reset et soft-reset

Paramétrage 

Fonction 

power-reset (valeur par défaut)

Exécute les diagnostics uniquement lors des réinitialisations à la mise sous-tension. 

error-reset

 Exécute les diagnostics uniquement lors des réinitialisations à la mise sous-tension, en cas d'erreurs matérielles bloquantes et d'événements de réinitialisation du temporisateur de surveillance.

soft-reset

Exécute les diagnostics lors de toutes les réinitialisations (à l'exception des réinitialisations XIR), y compris lors de celles déclenchées par les commandes UNIX init 6 ou reboot.

none

Désactive le déclenchement automatique des diagnostics par tout événement de réinitialisation. Les utilisateurs peuvent toujours appeler les diagnostics manuellement en maintenant enfoncées les touches "Stop" et "d" lors de la mise sous tension du système, ou en tournant le commutateur à clé du panneau de commande dans la position Diagnostics lors de la mise sous tension du système. 

Dans l'exemple suivant, la variable diag-trigger est utilisée pour déclencher les diagnostics POST et OpenBoot lors de toutes les réinitialisations à l'exception des réinitialisations XIR.


ok setenv diag-switch? true
ok setenv diag-trigger soft-reset