In diesem Abschnitt finden Sie die neuesten Informationen zur dynamischen Rekonfiguration (DR) für Sun EnterpriseTM 6x00-, 5x00-, 4x00- und 3x00-Systeme unter der Version 8/99 der SolarisTM 7-Produktfamilie von Sun Microsystems. Eine detaillierte Beschreibung der dynamischen Rekonfiguration bei Sun Enterprise-Servern finden Sie im Handbuch Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems.
Die Version 8/99 bietet Unterstützung für CPU-/Speicherplatinen in Sun Enterprise 6x00-, 5x00-, 4x00- und 3x00-Systemen.
Bevor Sie fortfahren, müssen Sie sicherstellen, daß das System die dynamische Rekonfiguration unterstützt. Wenn die folgende Meldung auf der Konsole oder in den Konsolenprotokollen erscheint, basiert die Hardware auf einem älteren Design und unterstützt die dynamische Rekonfiguration nicht.
Hot Plug not supported in this system
Die unterstützten E/A-Platinen sind im Abschnitt "Solaris 7 8/99" auf der folgenden Website aufgeführt
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
E/A-Platinen des Typs 2 (Grafik), des Typs 3 (PCI) und des Typs 5 (Grafik und SOC+) werden zur Zeit nicht unterstützt.
Für Sun StorEdgeTM A5000Festplatten-Arrays und für interne FC-AL-Festplatten bei Sun Enterprise 3500-Systemen muß die Firmware-Version ST19171FC 0413 oder höher verwendet werden. Weitere Informationen finden Sie im Abschnitt "Solaris 7 8/99" auf der folgenden Website:
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
Wenn unter Solaris 7 8/99 die dynamische Rekonfiguration verwendet werden soll, muß die CPU PROM-Version 3.2.22 (Firmware-Patch 103346-xx) oder höher installiert sein. Diese Firmware kann über die Website abgerufen werden (siehe "Abrufen von Firmware".)
Bei älteren Versionen des CPU PROM erscheint beim Systemstart möglicherweise die folgende Meldung:
Firmware does not support Dynamic Reconfiguration
Bei CPU PROM 3.2.16 und früheren Versionen wird diese Meldung nicht angezeigt, obwohl die dynamische Rekonfiguration von CPU-/Speicherplatinen nicht unterstützt wird.
Wenn Sie die aktuelle PROM-Version anzeigen lassen wollen, geben Sie an der Eingabeaufforderung ok die Befehle .version und banner ein. Es wird ein Bildschirm wie der folgende angezeigt:
ok .version |
Slot 0 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 1 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 2 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 3 - I/O Type 4 FCODE 1.8.22 1999/xx/xx 19:27 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 4 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 5 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 6 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 7 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 9 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 11 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 12 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 14 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
ok banner |
16-slot Sun Enterprise E6500 |
OpenBoot 3.2.22, 4672 MB memory installed, Serial #xxxxxxxx. |
Ethernet address 8:0:xx:xx:xx:xx, Host ID: xxxxxxxx. |
Informationen zum Aktualisieren der Firmware finden Sie im Abschnitt "Solaris 7 8/99" auf der folgenden Website.
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
Auf dieser Website werden folgende Themen erläutert:
Herunterladen der DR-fähigen PROM-Firmware
Aktualisieren des PROM
Wenn Sie keinen Zugang zu dieser Website haben, wenden Sie sich bitte an Ihren Sun-Kundendienst.
In der Datei /etc/system müssen zwei Variablen gesetzt werden, um die dynamische Rekonfiguration zu aktivieren, und eine weitere Variable muß gesetzt werden, um das Entfernen von CPU-/Speicherplatinen zu ermöglichen.
Melden Sie sich als Root an.
Um die dynamische Rekonfiguration zu aktivieren, fügen Sie die folgenden zwei Zeilen in die Datei /etc/system ein:
set pln:pln_enable_detach_suspend=1 set soc:soc_enable_detach_suspend=1
Um das Entfernen von CPU-/Speicherplatinen zu ermöglichen, fügen Sie die folgende Zeile in die Datei /etc/system ein:
set kernel_cage_enable=1
Indem Sie diese Variable setzen, ermöglichen Sie die Speicherdekonfiguration.
Starten Sie das System neu, damit die Änderungen wirksam werden.
Auf einem großen System kann die Ausführung des quiesce-test-Befehls (cfgadm -x quiesce-test sysctrl0:slotNummer) eine Minute dauern. In dieser Zeit werden keine Meldungen ausgegeben, sofern cfgadm keine inkompatiblen Treiber findet. Dieses Verhalten ist normal.
Wenn eine Platine in der Liste der deaktivierten Platinen aufgeführt ist, wird bei dem Versuch, diese Platine anzuschließen, eine Fehlermeldung ausgegeben:
# cfgadm -c connect sysctrl0:slotNummer cfgadm: Hardware specific failure: connect failed: board is disabled: must override with [-f][-o enable-at-boot]
Um die Platine anzuschließen, obwohl sie deaktiviert ist, verwenden Sie den Befehl cfgadm mit der Option -f oder der Aktivierungsoption (-o enable-at-boot):
# cfgadm -f -c connect sysctrl0:slotNummer
# cfgadm -o enable-at-boot -c connect sysctrl0:slotNummer
Um alle Platinen aus der Liste der deaktivierten Platinen zu entfernen, setzen Sie die Variable "disabled-board-list" mit dem folgenden Systembefehl auf Null:
# eeprom disabled-board-list=
An der OpenBootTM-Eingabeaufforderung verwenden Sie zu diesem Zweck statt dessen den folgenden OBP-Befehl:
OK set-default disabled-board-list
Weitere Informationen über das Setzen der Variablen disabled-board-list finden Sie im Abschnitt "Specific NVRAM Variables" im Handbuch Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems, Teilenummer 805-4454.
Weitere Informationen zum Setzen der OBP-Variablen disabled-memory-list finden Sie im Abschnitt "Specific NVRAM Variables" im Handbuch Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems, Teilenummer 805-4454.
Sollte es erforderlich sein, Treiber zu entladen, die beim Abhängen Probleme bereiten könnten, ermitteln Sie mit der Befehlszeile modinfo(1M) die Modul-IDs der Treiber. Diese können Sie dann im Befehl modunload(1M) zum Entladen der Treiber verwenden, die beim Abhängen Probleme verursachen können.
Eine Speicherplatine oder CPU-/Speicherplatine mit aktiviertem Speicher-Interleaving kann nicht dynamisch dekonfiguriert werden.
Um zu ermitteln, ob das Speicher-Interleaving aktiviert ist, verwenden Sie den Befehl prtdiag oder cfgadm.
Um DR-Operationen bei CPU-/Speicherplatinen zu ermöglichen, setzen Sie die NVRAM-Eigenschaft memory-interleave auf min.
Weitere Informationen zum Speicher-Interleaving finden Sie unter "Speicher-Interleaving nach einem schwerwiegenden Zurücksetzen falsch eingestellt, Fehler 4156075 " und unter "DR: Dekonfiguration einer CPU-/Speicherplatine mit aktiviertem Speicher-Interleaving ist nicht möglich, Fehler 4210234".
Wenn während einer DR Connect-Operation die Fehlermeldung "cfgadm: Hardware specific failure: connect failed: firmware operation error" angezeigt wird, entfernen Sie die Platine möglichst bald aus dem System. Der Selbsttest der Platine ist fehlgeschlagen, und durch das Entfernen dieser Platine vermeiden Sie mögliche Rekonfigurationsprobleme beim nächsten Systemstart.
Wenn Sie die fehlgeschlagene Operation sofort erneut ausführen wollen, müssen Sie die Platine zunächst entfernen und dann wieder einsetzen. Andernfalls läßt der Status der Platine keine weiteren Operationen zu.
Wie im Handbuch Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems erwähnt, unterstützt die Systemüberwachungs- und System-Management-Software Sun Enterprise SyMONTM die dynamische Rekonfiguration. Im Benutzerhandbuch wird jedoch auf das falsche Handbuch verwiesen. Relevante Informationen finden Sie im Handbuch Sun Enterprise SyMON 2.0.1(TM) Ergänzung für Sun Enterprise(TM) Midrange Servers, Teilenummer 806-1157.
Die neuesten Informationen zu Fehlern und Patches finden Sie unter: http://sunsolve5.sun.com/sunsolve/Enterprise-dr.
Kategorie: RFE
Der Speichertest sollte von Zeit zu Zeit zu erkennen geben, daß er noch ausgeführt wird. Wenn ein Test länger dauert, ist für den Benutzer kaum zu erkennen, ob sich das System nicht aufgehängt hat.
Workaround: Überwachen Sie mit vmstat(1M), ps(1) oder ähnlichen Shell-Befehlen den Systemstatus in einer anderen Shell oder einem anderen Fenster.
Kategorie: Fehler
Nach einem schwerwiegenden Zurücksetzen auf einem Sun Enterprise X500-Server befindet sich das Speicher-Interleaving in einem fehlerhaften Status. Alle folgenden DR-Operationen schlagen fehl. Das Problem tritt nur auf, wenn das Speicher-Interleaving auf min gesetzt ist.
Workarounds: Es gibt die zwei unten genannten Möglichkeiten.
Zum Beheben des Problems, nachdem es aufgetreten ist, setzen Sie das System an der Eingabeaufforderung OK manuell zurück.
Um das Problem zu vermeiden, setzen Sie die NVRAM-Eigenschaft memory-interleave auf max. Dies aktiviert das Speicher-Interleaving bei jedem Systemstart. Diese Möglichkeit ist jedoch unter Umständen nicht geeignet, denn eine Speicherplatine mit aktiviertem Speicher-Interleaving kann nicht dynamisch dekonfiguriert werden (siehe "DR: Dekonfiguration einer CPU-/Speicherplatine mit aktiviertem Speicher-Interleaving ist nicht möglich, Fehler 4210234").
Kategorie: Fehler
vmstat gibt nach der Konfiguration von CPUs eine außergewöhnlich hohe Anzahl an Interrupts aus. Während vmstat im Hintergrund läuft, wird der Wert im Interrupt-Feld ungewöhnlich groß. Dies deutet jedoch nicht darauf hin, daß ein Problem vorliegt. In der letzten Zeile im Beispiel unten weist die Interrupt-Spalte (in) den Wert 4294967216 auf:
# procs memory page disk faults cpu |
r b w swap free re mf pi po fr de sr s6 s9 s1 -- in sy cs us sy id |
0 0 0 437208 146424 0 1 4 0 0 0 0 0 1 0 0 50 65 79 0 1 99 |
0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 198 137 214 0 3 97 |
0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 286 101 200 0 3 97 |
0 0 0 413864 111072 0 11 0 0 0 0 0 0 1 0 0 4294967216 43 68 0 0 100 |
Workaround: Starten Sie vmstat neu.
Kategorie: Fehler
Wenn zwei CPUs auf einer Platine ausfallen, bevor eine Meldung an die Master-CPU erfolgt, wird in der POST-Statusanzeige für Systemplatinen nur eine CPU als ausgefallen aufgeführt, während die zweite CPU möglicherweise gar nicht erscheint.
Workaround: keiner.
Kategorie: RFE
Eine CPU-/Speicherplatine mit aktiviertem Speicher-Interleaving kann nicht dekonfiguriert werden.
Wenn Sie eine CPU-Platine mit Hauptspeicher oder eine reine Hauptspeicherplatine dekonfigurieren und danach vom System trennen wollen, muß der Speicher zunächst dekonfiguriert werden. Wenn für den Speicher auf der Platine jedoch das Speicher-Interleaving mit Speicher auf anderen Platinen aktiviert ist, kann der Speicher nicht dynamisch dekonfiguriert werden.
Ob das Speicher-Interleaving aktiviert ist, können Sie mit dem Befehl prtdiag oder cfgadm überprüfen.
Workaround: Fahren Sie das System herunter, bevor Sie an der Platine Wartungsarbeiten vornehmen, und starten Sie es danach neu. Sollen zukünftig DR-Operationen mit der CPU-/Speicherplatine möglich sein, muß die NVRAM-Eigenschaft memory-interleave auf min gesetzt sein. Weitere relevante Informationen zum Speicher-Interleaving finden Sie unter "Speicher-Interleaving nach einem schwerwiegenden Zurücksetzen falsch eingestellt, Fehler 4156075 ".
Kategorie: RFE
Wenn Sie eine CPU-Platine mit Hauptspeicher oder eine reine Hauptspeicherplatine dekonfigurieren und danach vom System trennen wollen, muß der Speicher zunächst dekonfiguriert werden. Manche Speicherbereiche können zur Zeit jedoch nicht neu zugewiesen werden. Solche Speicherbereiche sind permanent.
Permanenter Speicher auf einer Platine ist in der cfgadm-Statusanzeige als "permanent" gekennzeichnet:
# cfgadm -s cols=ap_id:type:info Ap_Id Type Information ac0:bank0 memory slot3 64Mb base 0x0 permanent ac0:bank1 memory slot3 empty ac1:bank0 memory slot5 empty ac1:bank1 memory slot5 64Mb base 0x40000000
In diesem Beispiel befindet sich auf der Platine in Steckplatz 3 permanenter Speicher. Die Platine kann also nicht entfernt werden.
Workaround: Fahren Sie das System herunter, bevor Sie an der Platine Wartungsarbeiten vornehmen, und starten Sie es danach neu.
Kategorie: Fehler
Wenn für eine Platine ein cfgadm-Prozeß läuft, schlägt der Versuch, gleichzeitig eine zweite Platine zu trennen, fehl.
Eine cfgadm Disconnect-Operation schlägt fehl, wenn ein weiterer cfgadm-Prozeß bereits für eine andere Platine läuft. Die folgende Meldung wird ausgegeben:
cfgadm: Hardware specific failure: disconnect failed: nexus error during detach: Adresse
Workaround: Führen Sie immer nur eine cfgadm-Operation aus. Wenn eine cfgadm-Operation für eine Platine läuft, warten Sie, bis diese abgeschlossen ist, bevor Sie eine cfgadm Disconnect-Operation für eine zweite Platine starten.
Kategorie: Fehler
Wenn Sie das System mit dem Befehl init 5 herunterfahren, nachdem DR-Operationen ausgeführt wurden, kann es zu einem schwerwiegenden Zurücksetzen kommen.
Workaround: Setzen Sie das System zurück, und schalten Sie es dann mit dem Befehl power-off an der Eingabeaufforderung ok aus.
Wenn ein Server als Boot-Server für x86-Clients konfiguriert wird, die auf Solaris 2.5.1 basieren, laufen mehrere rpld-Jobs, unabhängig davon, ob die Geräte benutzt werden. Aufgrund dieser aktiven Verweise können solche Geräte mit DR-Operationen nicht abgehängt werden.
Workaround: Gehen Sie folgendermaßen vor, um eine DR Detach-Operation auszuführen: