In diesem Abschnitt finden Sie die neuesten Informationen zur dynamischen Rekonfiguration (DR) für Sun Enterprise 6x00-, 5x00-, 4x00- und 3x00-Systeme unter der Betriebsumgebung Solaris 8 7/01 von Sun Microsystems. Eine detaillierte Beschreibung der dynamischen Rekonfiguration bei Sun Enterprise-Servern finden Sie im Handbuch Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems.
Die Betriebsumgebung Solaris 8 7/01 bietet Unterstützung für CPU-/Speicherplatinen und die meisten E/A-Platinen in Sun Enterprise 6x00-, 5x00-, 4x00- und 3x00-Systemen.
Bevor Sie fortfahren, müssen Sie sicherstellen, daß das System die dynamische Rekonfiguration unterstützt. Wenn die folgende Meldung auf der Konsole oder in den Konsolenprotokollen erscheint, basiert die Hardware auf einem älteren Design und unterstützt die dynamische Rekonfiguration nicht.
Hot Plug not supported in this system |
Die unterstützten E/A-Platinen sind im Abschnitt "Solaris 8" auf der folgenden Website aufgeführt:
http://sunsolve5.sun.com/sunsolve/Enterprise-dr
E/A-Platinen des Typs 2 (Grafik), des Typs 3 (PCI) und des Typs 5 (Grafik und SOC+) werden zur Zeit nicht unterstützt.
Für Sun StorEdge A5000 Festplatten-Arrays und für interne FC-AL-Festplatten bei Sun Enterprise 3500-Systemen muß die Firmware-Version ST19171FC 0413 oder eine höhere, kompatible Version verwendet werden. Weitere Informationen finden Sie im Abschnitt "Solaris 8" auf der folgenden Website:
http://sunsolve5.sun.com/sunsolve/Enterprise-dr
Wenn unter Solaris 8 7/01 die Dynamic Reconfiguration verwendet werden soll, muß die CPU PROM-Version 3.2.22 (Firmware-Patch 103346-xx) oder höhere, kompatible Version installiert sein. Diese Firmware kann über die Website abgerufen werden (siehe "Abrufen von Firmware".)
Bei älteren Versionen des CPU PROM erscheint beim Systemstart möglicherweise folgende Meldung:
Firmware does not support Dynamic Reconfiguration |
Bei CPU PROM 3.2.16 und früheren Versionen wird diese Meldung nicht angezeigt, obwohl die dynamische Rekonfiguration von CPU-/Speicherplatinen nicht unterstützt wird.
Wenn Sie die aktuelle PROM-Version anzeigen lassen wollen, geben Sie an der Eingabeaufforderung ok die Befehle .version und banner ein.
Es wird ein Bildschirm wie der folgende angezeigt:
ok .version Slot 0 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31 Slot 1 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31 Slot 2 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 Slot 3 - I/O Type 4 FCODE 1.8.22 1999/xx/xx 19:27 iPOST 3.4.22 1999/xx/xx 19:31 Slot 4 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 Slot 5 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 Slot 6 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 Slot 7 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 Slot 9 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 Slot 11 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 Slot 12 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 Slot 14 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 ok banner 16-slot Sun Enterprise E6500 OpenBoot 3.2.22, 4672 MB memory installed, Serial #xxxxxxxx. Ethernet address 8:0:xx:xx:xx:xx, Host ID: xxxxxxxx. |
Informationen zum Aktualisieren der Firmware finden Sie im Abschnitt "Solaris 8" auf der folgenden Website.
http://sunsolve5.sun.com/sunsolve/Enterprise-dr
Auf dieser Website werden folgende Themen erläutert:
Herunterladen der DR-fähigen PROM-Firmware
Aktualisieren des PROM
Wenn Sie keinen Zugang zu dieser Website haben, wenden Sie sich bitte an Ihren Sun-Kundendienst.
In der Datei /etc/system müssen zwei Variablen gesetzt werden, um die dynamische Rekonfiguration zu aktivieren, und eine weitere Variable muß gesetzt werden, um das Entfernen von CPU-/Speicherplatinen zu ermöglichen.
Melden Sie sich als Superuser an.
Um die dynamische Rekonfiguration zu aktivieren, fügen Sie die folgenden zwei Zeilen in die Datei /etc/system ein:
set pln:pln_enable_detach_suspend=1 set soc:soc_enable_detach_suspend=1 |
Um das Entfernen von CPU-/Speicherplatinen zu ermöglichen, fügen Sie die folgende Zeile in die Datei /etc/system ein:
set kernel_cage_enable=1 |
Indem Sie diese Variable setzen, ermöglichen Sie die Speicherdekonfiguration.
Starten Sie das System neu, damit die Änderungen wirksam werden.
Auf einem großen System kann die Ausführung des quiesce-test-Befehls (cfgadm -x quiesce-test sysctrl0:slotNummer) eine Minute dauern. In dieser Zeit werden keine Meldungen ausgegeben, sofern cfgadm keine inkompatiblen Treiber findet. Dieses Verhalten ist normal.
Wenn eine Platine in der Liste der deaktivierten Platinen aufgeführt ist, wird bei dem Versuch, diese Platine anzuschließen, eine Fehlermeldung ausgegeben:
# cfgadm -c connect sysctrl0:slotNummer cfgadm: Hardware specific failure: connect failed: board is disabled: must override with [-f][-o enable-at-boot] |
Um die Platine anzuschließen, obwohl sie deaktiviert ist, verwenden Sie den Befehl cfgadm mit der Option -f oder der Aktivierungsoption (-o enable-at-boot):
# cfgadm -f -c connect sysctrl0:slotNummer |
# cfgadm -o enable-at-boot -c connect sysctrl0:slotNummer |
Um alle Platinen aus der Liste der deaktivierten Platinen zu entfernen, setzen Sie die Variable "disabled-board-list" mit dem folgenden Systembefehl auf Null:
# eeprom disabled-board-list= |
An der OpenBoot-Eingabeaufforderung verwenden Sie zu diesem Zweck statt dessen den folgenden OBP-Befehl:
OK set-default disabled-board-list |
Weitere Informationen über das Setzen der Variablen disabled-board-list finden Sie unter "Specific NVRAM Variables" im Handbuch Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems im Sun Hardware Collection AnswerBook in dieser Version.
Weitere Informationen zum Setzen der Open Boot PROM-Variablen disabled-memory-list finden Sie unter "Specific NVRAM Variables" im Handbuch Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems im Sun Hardware Collection AnswerBook in dieser Version.
Sollte es erforderlich sein, Treiber zu entladen, die beim Abhängen Probleme bereiten könnten, ermitteln Sie mit der Befehlszeile modinfo(1M) die Modul-IDs der Treiber. Diese können Sie dann im Befehl modunload(1M) zum Entladen der Treiber verwenden, die beim Abhängen Probleme verursachen können.
Eine Speicherplatine oder CPU-/Speicherplatine mit aktiviertem Speicher-Interleaving kann nicht dynamisch dekonfiguriert werden.
Um zu ermitteln, ob das Speicher-Interleaving aktiviert ist, verwenden Sie den Befehl prtdiag oder cfgadm.
Um DR-Operationen bei CPU-/Speicherplatinen zu ermöglichen, setzen Sie die NVRAM-Eigenschaft memory-interleave auf min.
Weitere Informationen zum Speicher-Interleaving finden Sie unter "Speicher-Interleaving nach einem schwerwiegenden Zurücksetzen falsch eingestellt (Bug-ID 4156075)" und unter "DR: Dekonfiguration einer CPU-/Speicherplatine mit aktiviertem Speicher-Interleaving ist nicht möglich (Bug-ID 4210234)".
Wenn während einer DR Connect-Operation die Fehlermeldung "cfgadm: Hardware specific failure: connect failed: firmware operation error" angezeigt wird, entfernen Sie die Platine möglichst bald aus dem System. Der Selbsttest der Platine ist fehlgeschlagen, und durch das Entfernen dieser Platine vermeiden Sie mögliche Rekonfigurationsprobleme beim nächsten Systemstart.
Wenn Sie die fehlgeschlagene Operation sofort erneut ausführen wollen, müssen Sie die Platine zunächst entfernen und dann wieder einsetzen. Andernfalls läßt der Status der Platine keine weiteren Operationen zu.
Die folgende Liste unterliegt ständigen Änderungen. Die neuesten Informationen zu Fehlern und Patches finden Sie unter: .
http://sunsolve5.sun.com/sunsolve/Enterprise-dr
Der Speichertest sollte von Zeit zu Zeit zu erkennen geben, daß er noch ausgeführt wird. Wenn ein Test länger dauert, ist für den Benutzer kaum zu erkennen, ob sich das System nicht aufgehängt hat.
Workaround: Überwachen Sie mit vmstat(1M), ps(1) oder ähnlichen Shell-Befehlen den Systemstatus in einer anderen Shell oder einem anderen Fenster.
Nach Neustart eines Sun Enterprise x500-Servers wegen schwerwiegenden Fehlers befindet sich das Speicher-Interleaving in einem fehlerhaften Status. Alle folgenden DR-Operationen schlagen fehl. Das Problem tritt nur auf, wenn das Speicher-Interleaving auf min gesetzt ist.
Workaround: Es gibt die zwei unten genannten Möglichkeiten.
Zum Beheben des Problems, nachdem es aufgetreten ist, setzen Sie das System an der Eingabeaufforderung OK manuell zurück.
Um das Problem zu vermeiden, setzen Sie die NVRAM-Eigenschaft memory-interleave auf max.
Dies aktiviert das Speicher-Interleaving bei jedem Systemstart. Diese Möglichkeit ist jedoch unter Umständen nicht geeignet, denn eine Speicherplatine mit aktiviertem Speicher-Interleaving kann nicht dynamisch dekonfiguriert werden (siehe "DR: Dekonfiguration einer CPU-/Speicherplatine mit aktiviertem Speicher-Interleaving ist nicht möglich (Bug-ID 4210234)").
vmstat gibt nach der Konfiguration von CPUs eine außergewöhnlich hohe Anzahl an Interrupts aus. Während vmstat im Hintergrund läuft, wird der Wert im Interrupt-Feld ungewöhnlich groß. Dies deutet jedoch nicht darauf hin, daß ein Problem vorliegt. In der letzten Zeile im Beispiel unten weist die Interrupt-Spalte (in) den Wert 4294967216 auf:
# procs memory page disk faults cpu r b w swap free re mf pi po fr de sr s6 s9 s1 -- in sy cs us sy id 0 0 0 437208 146424 0 1 4 0 0 0 0 0 1 0 0 50 65 79 0 1 99 0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 198 137 214 0 3 97 0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 286 101 200 0 3 97 0 0 0 413864 111072 0 11 0 0 0 0 0 0 1 0 0 4294967216 43 68 0 0 100 |
Workaround: Starten Sie vmstat neu.
Eine CPU-/Speicherplatine mit aktiviertem Speicher-Interleaving kann nicht dekonfiguriert werden.
Wenn Sie eine CPU-Platine mit Hauptspeicher oder eine reine Hauptspeicherplatine dekonfigurieren und danach vom System trennen wollen, muß der Speicher zunächst dekonfiguriert werden. Wenn für den Speicher auf der Platine jedoch das Speicher-Interleaving mit Speicher auf anderen Platinen aktiviert ist, kann der Speicher nicht dynamisch dekonfiguriert werden.
Ob das Speicher-Interleaving aktiviert ist, können Sie mit dem Befehl prtdiag oder cfgadm überprüfen.
Workaround: Fahren Sie das System herunter, bevor Sie an der Platine Wartungsarbeiten vornehmen, und starten Sie es danach neu. Sollen zukünftig DR-Operationen mit der CPU-/Speicherplatine möglich sein, muß die NVRAM-Eigenschaft memory-interleave auf min gesetzt sein. Weitere relevante Informationen zum Speicher-Interleaving finden Sie unter "Speicher-Interleaving nach einem schwerwiegenden Zurücksetzen falsch eingestellt (Bug-ID 4156075)".
Wenn Sie eine CPU-Platine mit Hauptspeicher oder eine reine Hauptspeicherplatine dekonfigurieren und danach vom System trennen wollen, muß der Speicher zunächst dekonfiguriert werden. Manche Speicherbereiche können zur Zeit jedoch nicht neu zugewiesen werden. Solche Speicherbereiche sind permanent.
Permanenter Speicher auf einer Platine ist in der cfgadm-Statusanzeige als "permanent" gekennzeichnet:
# cfgadm -s cols=ap_id:type:info Ap_Id Type Information ac0:bank0 memory slot3 64Mb base 0x0 permanent ac0:bank1 memory slot3 empty ac1:bank0 memory slot5 empty ac1:bank1 memory slot5 64Mb base 0x40000000 |
In diesem Beispiel befindet sich auf der Platine in Steckplatz 3 permanenter Speicher. Die Platine kann also nicht entfernt werden.
Workaround: Fahren Sie das System herunter, bevor Sie an der Platine Wartungsarbeiten vornehmen, und starten Sie es danach neu.
Wenn für eine Platine ein cfgadm-Prozeß läuft, schlägt der Versuch, gleichzeitig eine zweite Platine zu trennen, fehl.
Eine cfgadm Disconnect-Operation schlägt fehl, wenn ein weiterer cfgadm-Prozeß bereits für eine andere Platine läuft. Die folgende Meldung wird ausgegeben:
cfgadm: Hardware specific failure: disconnect failed: nexus error during detach: Adresse |
Workaround: Führen Sie immer nur eine cfgadm-Operation aus. Wenn eine cfgadm-Operation für eine Platine läuft, warten Sie, bis diese abgeschlossen ist, bevor Sie eine cfgadm Disconnect-Operation für eine zweite Platine starten.
Wenn ein Server als Boot-Server für Clients der Intel Plattform konfiguriert wird, die auf Solaris 2.5.1 basieren, laufen mehrere rpld-Jobs, unabhängig davon, ob die Geräte benutzt werden. Aufgrund dieser aktiven Verweise können solche Geräte mit DR-Operationen nicht abgehängt werden.
Workaround: Führen Sie eine DR Detach-Operation durch: