Plattform-Hinweise: Sun Ultra 450 Workstation und Ultra Enterprise 450 Server

Kapitel 2 Parameter für die Systemkonfiguration

Dieses Kapitel beschreibt die NVRAM-Konfigurationsvariablen und OBP-Befehle (OpenBoot PROM), die zur Konfiguration folgender Aspekte des Systemverhaltens von Ultra 450-Systemen zur Verfügung stehen:

Folgende NVRAM-Konfigurationsvariablen werden in diesem Kapitel erläutert:

Folgende OBP-Befehle werden in diesem Kapitel erläutert:

UPA-Abtastung

Ultra 450-Systeme basieren wie alle UltraSPARC(TM)-Systeme auf dem UPA-Hochgeschwindigkeitsbus (UPA = Ultra Port Architecture), einem geswitchtem Systembus mit bis zu 32 Anschluß-ID-Adressen (oder Steckplätzen) für Hochgeschwindigkeits-Geräte der Hauptplatine wie CPUs, E/A-Bridges und Grafikkarten. Während die meisten Ultra-Systeme nur über drei oder vier aktive UPA-Anschlüsse verfügen, bietet ein Ultra 450-System bis zu neun aktive Anschlüsse, die auf die folgenden Subsysteme verteilt sind.

Tabelle 2-1 Aktive Anschlüsse

Gerätetyp 

UPA-Steckplatz 

Physische Implementierung 

CPU 

0-3 

Vier Steckplätze 

UPA-PCI-Bridge 

4,6,1f 

Auf Hauptplatine gelötet 

UPA-Grafikkarte 

1d, 1e  

Zwei Steckplätze 

Die Reihenfolge der Abtastung dieser neun Anschluß-IDs kann nicht vom Benutzer gesteuert werden. Allerdings kann eine Liste mit Anschlüssen von der Abtastung ausgeschlossen werden, und zwar mit Hilfe der NVRAM-Variablen upa-port-skip-list. Im folgenden Beispiel werden anhand der Variablen upa-port-skip-list eine der UPA-PCI-Bridges und die primäre UPA-Grafikkarte von der UPA-Abtastungsliste ausgeschlossen.


ok setenv upa-port-skip-list 4,1d

Mit dieser Funktion können Sie ein bestimmtes Gerät von der Abtastung (und anschließendem Gebrauch) durch das System ausschließen, ohne die Einsteckkarte physisch entfernen zu müssen. Dies kann nützlich sein, wenn in einem System mit temporären Funktionsstörungen eine fehlerhafte Karte zu suchen ist.

PCI-Abtastung

Von den sechs PCI-Bussen des Ultra 450-Systems ist Bus 0 (/pci@1f,4000 in der Gerätebaumstruktur) insofern einzigartig, als es sich dabei um den einzigen PCI-Bus handelt, der Hauptplatinengeräte (nicht zum Einstecken) wie z. B. Standard-Ethernet- und SCSI-Controller enthält. Definitionsgemäß können diese Geräte nicht ausgesteckt und ausgetauscht werden, um dadurch die Reihenfolge zu ändern, in der die Abtastung erfolgt. Zum Steuern der Abtastungsreihenfolge dieser Geräte steht die NVRAM-Variable pci0-probe-list zur Verfügung. Mit dieser Variablen werden die Abtastreihenfolge und der Ausschluß von Geräten am PCI-Bus 0 festgelegt. Die Definition der Werte in pci0-probe-list können Sie folgender Tabelle entnehmen.

Tabelle 2-2 Werte der Variablen pci0-probe-list

PCI-Gerätenummer 

Funktion 

0

UPA-PCI-Bus-Bridge (nicht abgetastet) 

1

 EBus/Ethernet-Schnittstelle (immer abgetastet, nie in Abtastungsliste enthalten)

2

Integrierter SCSI-Controller für Wechseldatenträger und externen SCSI-Anschluß 

3

Integrierter SCSI-Controller für UltraSCSI-Backplane mit 4 Steckplätzen 

4

PCI-Steckplatz 10 auf der Rückseite 


Hinweis -

Die Werte in dieser Liste beziehen sich auf die PCI-Gerätenummer. Sie beziehen sich nicht auf die Steckplatznumerierung an der Rückseite (0-10).


Im folgenden Beispiel definiert die Variable pci0-probe-list eine Abtastung in der Reihenfolge 3-4, wobei der integrierte SCSI-Controller für Wechseldatenträger und den externen SCSI-Anschluß von der Abtastungsliste ausgeschlossen ist


ok setenv pci0-probe-list 3,4

.

Die Reihenfolge der Abtastung der anderen fünf PCI-Busse (PCI-Steckplatz 1 bis 9) kann nicht vom Benutzer gesteuert werden. Diese Steckplätze werden immer in folgender Reihenfolge abgetastet: 5-3-2-1-4-9-8-7-6. Allerdings kann eine Liste mit PCI-Steckplätzen von der Abtastung ausgeschlossen werden, und zwar mit Hilfe der NVRAM-Variablen pci-slot-skip-list. Im folgenden Beispiel bewirkt die Variable pci-slot-skip-list einen Ausschluß der Steckplätze 3 und 8 an der Rückseite von der PCI-Abtastungsliste.


ok setenv pci-slot-skip-list 3,8


Hinweis -

Die Werte der Variablen pci-slot-skip-list beziehen sich auf die Numerierung an der Systemrückseite (1-10). Enthält diese Liste Steckplatz 10, wird er von der Abtastung ausgeschlossen, auch wenn pci0-probe-list die Gerätenummer 4 (Steckplatz 10 an der Rückseite) enthält.


Speicher-Interleaving

Das Speicher-Interleaving in einem Ultra 450-System wird mit der NVRAM-Variablen memory-interleave gesteuert. Die folgende Tabelle enthält die verschiedenen Einstellungen für diese Variable und die Wirkung der einzelnen Einstellungen auf die Speicherkonfiguration. Weitere Erläuterungen zum Speicher-Interleaving und Speicherkonfigurationsregeln finden Sie unter "Informationen über Speicher" im Benutzerhandbuch, das mit dem Ultra 450-System geliefert wird.

Tabelle 2-3 Einstellungen für die Variable memory-interleave

Einstellung 

Wirkung auf Speicherkonfiguration 

auto (Standard)

Aktiviert Four-Way-Interleaving, wenn alle vier Speicherbänke DIMMs gleicher Kapazität enthalten. Aktiviert Two-Way-Interleaving, wenn nur die Bänke A und B verwendet werden und beide Bänke mit DIMMs gleicher Kapazität bestückt sind. Andernfalls wird das Interleaving deaktiviert. 

max-size

Entspricht bei Ultra 450-Systemen der Einstellung auto.

max-interleave

Aktiviert den höchsten Interleaving-Wert, der bei einer bestimmten Speicherkonfiguration möglich ist, aber ein Teil der Speicherkapazität bleibt ungenutzt, wenn DIMMs mit unterschiedlicher Kapazität installiert sind. In jedem DIMM wird nur soviel Speicher genutzt, wie mit dem DIMM mit der geringsten Kapazität installiert ist. 

1

Deaktiviert das Interleaving; nutzt die gesamte zur Verfügung stehende Speicherkapazität. 

2

Bewirkt Two-Way-Interleaving zwischen den Bänken A und B. Ein Teil der Speicherkapazität bleibt ungenutzt, wenn DIMMs mit unterschiedlicher Kapazität installiert sind. Das DIMM mit der geringsten Kapazität muß in Bank B eingesetzt sein. Die Bänke C und D, falls bestückt, bleiben ungenutzt. 

4

Bewirkt Four-Way-Interleaving zwischen allen vier Bänken. Ein Teil der Speicherkapazität bleibt ungenutzt, wenn DIMMs mit unterschiedlicher Kapazität installiert sind. Das DIMM mit der geringsten Kapazität muß in Bank D eingesetzt sein. 

Das folgende Beispiel zeigt, wie Sie das System konfigurieren, um ein maximales Speicher-Interleaving zu erzielen.


ok setenv memory-interleave max-interleave

Umgebungsüberwachung und -steuerung

Funktionen für die Umgebungsüberwachung und -steuerung gibt es bei einem Ultra 450-System auf Betriebssystemebene und auf OBP-Firmware-Ebene. Damit ist sichergestellt, daß einsatzfähige Überwachungsfunktionen selbst dann zur Verfügung stehen, wenn das System angehalten wurde oder nicht gebootet werden kann. Wie das OBP eine zu hohe Umgebungstemperatur erkennt und darauf reagiert, wird über die NVRAM-Variable env-monitor festgelegt. Die folgende Tabelle zeigt die verschiedenen Einstellungen für diese Variable und die Wirkung dieser Einstellungen auf das Verhalten des OBP. Weitere Erläuterungen zu den Umgebungsüberwachungsfunktionen des Systems finden Sie unter "Informationen über Leistungsmerkmale, Ausfallsicherheit, Verfügbarkeit und Servicefreundlichkeit" im Benutzerhandbuch, das mit dem Ultra 450-System geliefert wird.

Tabelle 2-4 Einstellungen für die Variable env-monitor

Einstellung 

Überwachung aktiv? 

Maßnahme 

enabled (Standard)

Ja 

Bei einer überhöhten Temperatur oder einem Ventilatorausfall in der CPU oder der Festplattenlüftereinheit gibt das OBP eine Warnung aus und fährt das System nach 30 Sekunden automatisch herunter. 

advise

Ja 

Das OBP gibt lediglich eine Warnung aus, fährt das System jedoch nicht herunter. 

disabled

Nein  

Das OBP reagiert überhaupt nicht. Die Umgebungsüberwachung auf OBP-Ebene ist deaktiviert. 

Im folgenden Beispiel bewirkt die Variable env-monitor eine Deaktivierung der Umgebungsüberwachung auf OBP-Ebene


ok setenv env-monitor disabled


Hinweis -

Diese NVRAM-Variable hat keinerlei Wirkung auf die Umgebungsüberwachungs- und -steuerfunktionen des Systems, solange das Betriebssystem läuft.


Automatische Systemwiederherstellung (ASR)

Dank der automatischen Systemwiederherstellung (ASR) kann ein Ultra 450-System den Betrieb auch nach bestimmten Ausfällen oder Fehlfunktionen der Hardware fortsetzen. Beim Systemtest nach dem Einschalten (POST = Power-On Self-Test) und bei der OpenBoot-Diagnose (OBDiag) werden defekte Hardware-Komponenten automatisch erkannt, und eine automatische Konfigurationsfunktion in der OBP-Firmware ermöglicht die Dekonfiguration defekter Komponenten und die Wiederherstellung des Systembetriebs. Sofern das System ohne die defekte Komponente funktionieren kann, ermöglicht die ASR-Funktion einen automatischen Neustart des Systems, und zwar ohne Benutzereingriff. Ein solcher "eingeschränkter Neustart" erlaubt eine Fortsetzung des Systembetriebs, während ein Wartungsaufruf generiert wird, der den Austausch der defekten Komponente anfordert.

Wird bei der Einschaltsequenz eine defekte Komponente erkannt, wird diese Komponente dekonfiguriert, und die Boot-Sequenz wird fortgesetzt, sofern das System ohne diese Komponente funktionsfähig ist. Bei einem laufenden System können bestimmte Fehlertypen, zum Beispiel ein Prozessorfehler, bewirken, daß das System automatisch zurückgesetzt wird. In diesem Fall kann das System dank der ASR-Funktion sofort neu starten, sofern es ohne die ausgefallene Komponente funktionsfähig ist. Auf diese Weise wird verhindert, daß eine defekte Hardware-Komponente ein Einschalten des Systems unmöglich macht oder sofort zu einem erneuten Systemabsturz führt.

"Software"-Dekonfiguration mittels Statuseigenschaft

Damit ein eingeschränkter Neustart möglich ist, "markiert" das OBP über die 1275 Client-Schnittstelle (via Gerätebaumstruktur) Geräte als failed (ausgefallen) oder disabled (deaktiviert), indem im zugehörigen Knoten der Gerätebaumstruktur eine entsprechende "Statuseigenschaft" angelegt wird. Für diesen Fall gilt die Konvention, daß UNIX für ein so markiertes Subsystem keinen Treiber aktiviert.

Solange sich die ausgefallene Komponente in einem elektrischen Ruhezustand befindet, also keine willkürlichen Busfehler oder Signalrauschen usw. verursacht, startet das System automatisch neu und nimmt den Betrieb wieder auf, während ein Wartungsaufruf generiert wird.

"Hardware"-Dekonfiguration

In zwei Sonderfällen der Dekonfiguration eines Subsystems (bei CPUs und dem Hauptspeicher) geht das OBP über das Anlegen einer entsprechenden "Statuseigenschaft" in der Gerätebaumstruktur hinaus. In den ersten Momenten nach dem Zurücksetzen muß das OBP die entsprechenden Komponenten initialisieren und funktionell konfigurieren (oder umgehen), damit das restliche System ordnungsgemäß funktionieren kann. Die entsprechenden Aktionen werden auf der Grundlage des Status der beiden NVRAM-Konfigurationsvariablen post-status und asr-status durchgeführt, die die Informationen zum Überschreiben enthalten. Diese Informationen werden entweder über den POST oder über manuelles Überschreiben durch den Benutzer zur Verfügung gestellt (siehe "Manuelles Überschreiben durch den Benutzer bei der automatischen Systemwiederherstellung (ASR)").

CPU-Dekonfiguration

Wenn eine CPU beim Systemtest nach dem Einschalten als defekt markiert wird oder ein Benutzer eine CPU deaktiviert, setzt das OBP das "Master Disable"-Bit für die betreffende CPU. So wird diese CPU bis zum nächsten Zurücksetzen des Systems beim Einschalten effektiv als aktives UPA-Gerät ausgeschaltet.

Speicher-Dekonfiguration

Hauptspeicherfehler zu erkennen und zu isolieren, ist eine der schwierigeren Diagnoseaufgaben. Noch komplizierter wird das Problem durch die verschiedenen Speicher-Interleaving-Modi des Systems und durch die Möglichkeit, DIMMs mit unterschiedlicher Kapazität innerhalb der gleichen Speicherbank zu installieren.

Bei einer defekten Hauptspeicherkomponente dekonfiguriert die Firmware die gesamte Speicherbank, in der der Fehler aufgetreten ist. Dies bedeutet jedoch auch, daß nach einem eingeschränkten Neustart der Interleave-Faktor geringer ist oder die Kapazität der restlichen Speicherbänke nicht zu 1000 % genutzt wird. Je nach Interleave-Faktor kann auch beides der Fall sein.

Manuelles Überschreiben durch den Benutzer bei der automatischen Systemwiederherstellung (ASR)

In den meisten Fällen wird das Ultra 450-System mittels der Standardeinstellungen ordnungsgemäß konfiguriert oder dekonfiguriert. Dennoch empfiehlt es sich, erfahrenen Benutzern eine Möglichkeit des manuellen Überschreibens zur Verfügung zu stellen. Und wegen der Unterschiede zwischen einer "Software-" und einer "Hardware"-Dekonfiguration sind dazu zwei verwandte, aber unterschiedliche Überschreibmechanismen erforderlich.

Überschreiben bei der "Software"-Dekonfiguration

Ein Subsystem, das durch einen bestimmten Knoten in der Gerätebaumstruktur dargestellt wird, kann vom Benutzer über die NVRAM-Variable asr-disable-list deaktiviert werden. Der Wert dieser Variablen besteht einfach aus einer Liste von Pfaden in der Gerätebaumstruktur, die durch Leerzeichen getrennt sind.


ok setenv asr-disable-list /pci/ebus/ecpp /pci@1f,4000/scsi@3

Anhand dieser Informationen weist das Ultra 450-OBP allen Knoten, die in der Variablen asr-disable-list aufgelistet sind, als Eigenschaft den deaktivierten Status ("disabled") zu.

Überschreiben bei der "Hardware"-Dekonfiguration

Bei Subsystemen, die eine "Hardware"-Dekonfiguration erfordern (CPU und Hauptspeicher), dienen die OBP-Befehle asr-enable und asr-disable zur selektiven Aktivierung oder Deaktivierung.


Hinweis -

Es gibt Überschneidungen zwischen dem Überschreiben bei Software- und Hardware-Dekonfiguration. Wenn möglich, sollten die Hardware-Überschreibbefehle asr-enable und asr-disable verwendet werden.


Sie können den Status aller manuell überschriebenen Subsysteme abrufen. Dazu dient ein neuer Benutzerbefehl, nämlich .asr. Dieser erzeugt eine Übersicht über die aktuellen Einstellungen


ok asr-disable cpu1 bank3
ok .asr
CPU0:	Enabled	
CPU1:	Disabled	
CPU2:	Enabled	
CPU3:	Enabled	
SC-Marvin:	Enabled	
Psycho@1f:	Enabled	
Psycho@4:	Enabled	
Psycho@6:	Enabled	
Cheerio:	Enabled	
SCSI:	Enabled	
Mem Bank0:	Enabled	
Mem Bank1:	Enabled	
Mem Bank2:	Enabled	
Mem Bank3:	Disabled	
PROM:	Enabled	
NVRAM:	Enabled	
TTY:	Enabled	
Audio:	Enabled	
SuperIO:	Enabled	
PCI Slots:	Enabled	

Optionen für den automatischen Systemstart

OpenBoot stellt einen NVRAM-gesteuerten Schalter mit der Bezeichnung auto-boot? zur Verfügung. Dieser legt fest, ob das OBP das Betriebssystem nach dem Zurücksetzen jedesmal automatisch neu startet. Der Standardwert bei Sun-Plattformen lautet true.

Wenn sich beim Systemtest nach dem Einschalten ein Problem ergibt, wird auto-boot? ignoriert, und ein Systemneustart erfolgt erst, wenn der Benutzer ihn manuell durchführt. Da ein solches Verhalten für einen eingeschränkten Neustart selbstverständlich nicht in Frage kommt, hält das OBP einen zweiten NVRAM-gesteuerten Schalter bereit. Dieser heißt auto-boot-on-error?. Von diesem Schalter hängt es ab, ob das System einen eingeschränkten Neustart versucht, wenn der Ausfall eines Subsystems erkannt wird. Ein eingeschränkter Neustart ist nur dann möglich, wenn beide Schalter, auto-boot? und auto-boot-on-error?, auf true gesetzt sind.


ok setenv auto-boot-on-error? true


Hinweis -

Die Standardeinstellung für auto-boot-on-error? lautet false. Das heißt, das System versucht keinen eingeschränkten Neustart, es sei denn, Sie ändern diese Einstellung in true.Darüber hinaus versucht das System auch keinen eingeschränkten Neustart, wenn es zu einem schweren und nicht behebbaren Fehler kommt, selbst wenn die Möglichkeit eines eingeschränkten Neustarts aktiviert ist. Ein Beispiel für einen schweren und nicht behebbaren Fehler ist die Deaktivierung beider System-CPUs, entweder durch einen Fehler beim Systemtest nach dem Einschalten oder durch einen Benutzereingriff (manuelles Überschreiben).


Rücksetz-Szenarien

Das Standardprotokoll für das Zurücksetzen des Systems umgeht die Firmware-Diagnose vollständig, es sei denn, die NVRAM-Variable diag-switch? ist auf true gesetzt. Die Standardeinstellung dieser Variablen lautet false.

Um bei Ultra 450-Systemen eine automatische Systemwiederherstellung zu unterstützen, ist eine Firmware-Diagnose (POST/OBDiag) bei einigen oder allen Rücksetz-Ereignissen wünschenswert. Statt nun einfach den Standardwert von diag-switch? in true zu ändern, was eine Reihe von Nebenwirkungen mit sich bringt (siehe das Handbuch OpenBoot 3.x Command Reference Manual), stellt das Ultra 450-OBP eine neue NVRAM-Variable namens diag-trigger zur Verfügung. Mit dieser Variablen können Sie festlegen, welche Rücksetz-Ereignisse (wenn überhaupt) automatisch eine Firmware-Diagnose (POST/OBDiag) auslösen sollen. Die Variable diag-trigger und ihre verschiedenen Einstellungen werden in der folgenden Tabelle erläutert.


Hinweis -

diag-trigger hat nur dann eine Wirkung, wenn diag-switch? auf true gesetzt ist.


Tabelle 2-5 Einstellungen für power-reset, error-reset und soft-reset

Einstellung 

Funktion 

power-reset (Standard)

Eine Diagnose wird nur beim Zurücksetzen beim Einschalten durchgeführt. 

error-reset

 Eine Diagnose wird nur beim Zurücksetzen beim Einschalten, schweren Hardware-Fehlern und Rücksetz-Ereignissen im Zusammenhang mit dem Systemüberwachungsprotokoll (Watchdog) durchgeführt.

soft-reset

Eine Diagnose wird beim Zurücksetzen immer durchgeführt (Ausnahme: XIR), auch wenn das Zurücksetzen durch die UNIX-Befehle init 6 oder reboot ausgelöst wird.

none

Unabhängig von der Art des Rücksetz-Ereignisses wird nie automatisch eine Diagnose durchgeführt. Der Benutzer kann eine Diagnose manuell auslösen, indem er die Tasten Stop und d beim Einschalten des Systems gedrückt hält oder indem er beim Einschalten des Systems den Schlüsselschalter am vorderen Bedienfeld in die Diagnoseposition bringt. 

Im folgenden Beispiel bewirkt die Variable diag-trigger, daß jedesmal beim Zurücksetzen (außer beim Zurücksetzen durch XIR) eine POST- und eine OpenBoot-Diagnose durchgeführt werden.


ok setenv diag-switch? true
ok setenv diag-trigger soft-reset