Solaris 8 7/01 Versionshinweise zu Sun - Hardware - Ergänzungen

Dynamic Reconfiguration bei Sun Enterprise 6x00-, 5x00-, 4x00- und 3x00-Systemen

In diesem Abschnitt finden Sie die neuesten Informationen zur dynamischen Rekonfiguration (DR) für Sun Enterprise 6x00-, 5x00-, 4x00- und 3x00-Systeme unter der Betriebsumgebung Solaris 8 7/01 von Sun Microsystems. Eine detaillierte Beschreibung der dynamischen Rekonfiguration bei Sun Enterprise-Servern finden Sie im Handbuch Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems.

Die Betriebsumgebung Solaris 8 7/01 bietet Unterstützung für CPU-/Speicherplatinen und die meisten E/A-Platinen in Sun Enterprise 6x00-, 5x00-, 4x00- und 3x00-Systemen.

Unterstützte Hardware

Bevor Sie fortfahren, müssen Sie sicherstellen, daß das System die dynamische Rekonfiguration unterstützt. Wenn die folgende Meldung auf der Konsole oder in den Konsolenprotokollen erscheint, basiert die Hardware auf einem älteren Design und unterstützt die dynamische Rekonfiguration nicht.


Hot Plug not supported in this system

Die unterstützten E/A-Platinen sind im Abschnitt "Solaris 8" auf der folgenden Website aufgeführt:

http://sunsolve5.sun.com/sunsolve/Enterprise-dr

E/A-Platinen des Typs 2 (Grafik), des Typs 3 (PCI) und des Typs 5 (Grafik und SOC+) werden zur Zeit nicht unterstützt.

Hinweise zur Firmware

FC-AL-Festplatten-Arrays und interne Laufwerke

Für Sun StorEdge A5000 Festplatten-Arrays und für interne FC-AL-Festplatten bei Sun Enterprise 3500-Systemen muß die Firmware-Version ST19171FC 0413 oder eine höhere, kompatible Version verwendet werden. Weitere Informationen finden Sie im Abschnitt "Solaris 8" auf der folgenden Website:

http://sunsolve5.sun.com/sunsolve/Enterprise-dr

PROM-Aktualisierungen für CPU- und E/A-Platinen

Wenn unter Solaris 8 7/01 die Dynamic Reconfiguration verwendet werden soll, muß die CPU PROM-Version 3.2.22 (Firmware-Patch 103346-xx) oder höhere, kompatible Version installiert sein. Diese Firmware kann über die Website abgerufen werden (siehe "Abrufen von Firmware".)

Bei älteren Versionen des CPU PROM erscheint beim Systemstart möglicherweise folgende Meldung:


Firmware does not support Dynamic Reconfiguration


Achtung - Achtung -

Bei CPU PROM 3.2.16 und früheren Versionen wird diese Meldung nicht angezeigt, obwohl die dynamische Rekonfiguration von CPU-/Speicherplatinen nicht unterstützt wird.


  1. Wenn Sie die aktuelle PROM-Version anzeigen lassen wollen, geben Sie an der Eingabeaufforderung ok die Befehle .version und banner ein.

    Es wird ein Bildschirm wie der folgende angezeigt:


    ok .version 
    Slot  0 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26  iPOST 3.4.22 1999/xx/xx 19:31
    Slot  1 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26  iPOST 3.4.22 1999/xx/xx 19:31
    Slot  2 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  3 - I/O Type 4 FCODE 1.8.22 1999/xx/xx 19:27  iPOST 3.4.22 1999/xx/xx 19:31
    Slot  4 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  5 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  6 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  7 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  9 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot 11 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot 12 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot 14 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    ok banner
    16-slot Sun Enterprise E6500
    OpenBoot 3.2.22, 4672 MB memory installed, Serial #xxxxxxxx.
    Ethernet address 8:0:xx:xx:xx:xx, Host ID: xxxxxxxx.

Abrufen von Firmware

Informationen zum Aktualisieren der Firmware finden Sie im Abschnitt "Solaris 8" auf der folgenden Website.

http://sunsolve5.sun.com/sunsolve/Enterprise-dr

Auf dieser Website werden folgende Themen erläutert:

Wenn Sie keinen Zugang zu dieser Website haben, wenden Sie sich bitte an Ihren Sun-Kundendienst.

Hinweise zur Software

Aktivieren der dynamischen Rekonfiguration

In der Datei /etc/system müssen zwei Variablen gesetzt werden, um die dynamische Rekonfiguration zu aktivieren, und eine weitere Variable muß gesetzt werden, um das Entfernen von CPU-/Speicherplatinen zu ermöglichen.

  1. Melden Sie sich als Superuser an.

  2. Um die dynamische Rekonfiguration zu aktivieren, fügen Sie die folgenden zwei Zeilen in die Datei /etc/system ein:


    set pln:pln_enable_detach_suspend=1
    set soc:soc_enable_detach_suspend=1

  3. Um das Entfernen von CPU-/Speicherplatinen zu ermöglichen, fügen Sie die folgende Zeile in die Datei /etc/system ein:


    set kernel_cage_enable=1

    Indem Sie diese Variable setzen, ermöglichen Sie die Speicherdekonfiguration.

  4. Starten Sie das System neu, damit die Änderungen wirksam werden.

Quiesce-Test

Auf einem großen System kann die Ausführung des quiesce-test-Befehls (cfgadm -x quiesce-test sysctrl0:slotNummer) eine Minute dauern. In dieser Zeit werden keine Meldungen ausgegeben, sofern cfgadm keine inkompatiblen Treiber findet. Dieses Verhalten ist normal.

Liste der deaktivierten Platinen

Wenn eine Platine in der Liste der deaktivierten Platinen aufgeführt ist, wird bei dem Versuch, diese Platine anzuschließen, eine Fehlermeldung ausgegeben:


# cfgadm -c connect sysctrl0:slotNummer
cfgadm: Hardware specific failure: connect failed: board is
disabled: must override with [-f][-o enable-at-boot]

  1. Um die Platine anzuschließen, obwohl sie deaktiviert ist, verwenden Sie den Befehl cfgadm mit der Option -f oder der Aktivierungsoption (-o enable-at-boot):


    # cfgadm -f -c connect sysctrl0:slotNummer
    

    # cfgadm -o enable-at-boot -c connect sysctrl0:slotNummer
    

  1. Um alle Platinen aus der Liste der deaktivierten Platinen zu entfernen, setzen Sie die Variable "disabled-board-list" mit dem folgenden Systembefehl auf Null:


    # eeprom disabled-board-list=
    

  1. An der OpenBoot-Eingabeaufforderung verwenden Sie zu diesem Zweck statt dessen den folgenden OBP-Befehl:


    OK set-default disabled-board-list 
    

    Weitere Informationen über das Setzen der Variablen disabled-board-list finden Sie unter "Specific NVRAM Variables" im Handbuch Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems im Sun Hardware Collection AnswerBook in dieser Version.

Liste des deaktivierten Speichers

Weitere Informationen zum Setzen der Open Boot PROM-Variablen disabled-memory-list finden Sie unter "Specific NVRAM Variables" im Handbuch Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems im Sun Hardware Collection AnswerBook in dieser Version.

Entladen von nicht zum Abhängen geeigneten Treibern

Sollte es erforderlich sein, Treiber zu entladen, die beim Abhängen Probleme bereiten könnten, ermitteln Sie mit der Befehlszeile modinfo(1M) die Modul-IDs der Treiber. Diese können Sie dann im Befehl modunload(1M) zum Entladen der Treiber verwenden, die beim Abhängen Probleme verursachen können.

Speicher-Interleaving

Eine Speicherplatine oder CPU-/Speicherplatine mit aktiviertem Speicher-Interleaving kann nicht dynamisch dekonfiguriert werden.

Um zu ermitteln, ob das Speicher-Interleaving aktiviert ist, verwenden Sie den Befehl prtdiag oder cfgadm.

Um DR-Operationen bei CPU-/Speicherplatinen zu ermöglichen, setzen Sie die NVRAM-Eigenschaft memory-interleave auf min.

Weitere Informationen zum Speicher-Interleaving finden Sie unter "Speicher-Interleaving nach einem schwerwiegenden Zurücksetzen falsch eingestellt (Bug-ID 4156075)" und unter "DR: Dekonfiguration einer CPU-/Speicherplatine mit aktiviertem Speicher-Interleaving ist nicht möglich (Bug-ID 4210234)".

Fehlgeschlagener Selbsttest während einer Connect-Operation

Wenn während einer DR Connect-Operation die Fehlermeldung "cfgadm: Hardware specific failure: connect failed: firmware operation error" angezeigt wird, entfernen Sie die Platine möglichst bald aus dem System. Der Selbsttest der Platine ist fehlgeschlagen, und durch das Entfernen dieser Platine vermeiden Sie mögliche Rekonfigurationsprobleme beim nächsten Systemstart.

Wenn Sie die fehlgeschlagene Operation sofort erneut ausführen wollen, müssen Sie die Platine zunächst entfernen und dann wieder einsetzen. Andernfalls läßt der Status der Platine keine weiteren Operationen zu.

Bekannte Fehler

Die folgende Liste unterliegt ständigen Änderungen. Die neuesten Informationen zu Fehlern und Patches finden Sie unter: .

http://sunsolve5.sun.com/sunsolve/Enterprise-dr

cfgadm -v funktioniert nicht richtig (Bug-ID 4149371)

Der Speichertest sollte von Zeit zu Zeit zu erkennen geben, daß er noch ausgeführt wird. Wenn ein Test länger dauert, ist für den Benutzer kaum zu erkennen, ob sich das System nicht aufgehängt hat.

Workaround: Überwachen Sie mit vmstat(1M), ps(1) oder ähnlichen Shell-Befehlen den Systemstatus in einer anderen Shell oder einem anderen Fenster.

Speicher-Interleaving nach einem schwerwiegenden Zurücksetzen falsch eingestellt (Bug-ID 4156075)

Nach Neustart eines Sun Enterprise x500-Servers wegen schwerwiegenden Fehlers befindet sich das Speicher-Interleaving in einem fehlerhaften Status. Alle folgenden DR-Operationen schlagen fehl. Das Problem tritt nur auf, wenn das Speicher-Interleaving auf min gesetzt ist.

Workaround: Es gibt die zwei unten genannten Möglichkeiten.

  1. Zum Beheben des Problems, nachdem es aufgetreten ist, setzen Sie das System an der Eingabeaufforderung OK manuell zurück.

  1. Um das Problem zu vermeiden, setzen Sie die NVRAM-Eigenschaft memory-interleave auf max.

    Dies aktiviert das Speicher-Interleaving bei jedem Systemstart. Diese Möglichkeit ist jedoch unter Umständen nicht geeignet, denn eine Speicherplatine mit aktiviertem Speicher-Interleaving kann nicht dynamisch dekonfiguriert werden (siehe "DR: Dekonfiguration einer CPU-/Speicherplatine mit aktiviertem Speicher-Interleaving ist nicht möglich (Bug-ID 4210234)").

vmstat-Ausgabe ist nach der Konfiguration von Prozessoren fehlerhaft (Bug-ID 4159024)

vmstat gibt nach der Konfiguration von CPUs eine außergewöhnlich hohe Anzahl an Interrupts aus. Während vmstat im Hintergrund läuft, wird der Wert im Interrupt-Feld ungewöhnlich groß. Dies deutet jedoch nicht darauf hin, daß ein Problem vorliegt. In der letzten Zeile im Beispiel unten weist die Interrupt-Spalte (in) den Wert 4294967216 auf:


#  procs     memory            page            disk          faults      cpu
 r b w   swap  free  re  mf pi po fr de sr s6 s9 s1 --   in   sy   cs us sy id
 0 0 0 437208 146424  0   1  4  0  0  0  0  0  1  0  0   50   65   79  0  1 99
 0 0 0 413864 111056  0   0  0  0  0  0  0  0  0  0  0  198  137  214  0  3 97
 0 0 0 413864 111056  0   0  0  0  0  0  0  0  0  0  0  286  101  200  0  3 97
 0 0 0 413864 111072  0  11  0  0  0  0  0  0  1  0  0 4294967216 43 68 0 0 100

Workaround: Starten Sie vmstat neu.

DR: Dekonfiguration einer CPU-/Speicherplatine mit aktiviertem Speicher-Interleaving ist nicht möglich (Bug-ID 4210234)

Eine CPU-/Speicherplatine mit aktiviertem Speicher-Interleaving kann nicht dekonfiguriert werden.

Wenn Sie eine CPU-Platine mit Hauptspeicher oder eine reine Hauptspeicherplatine dekonfigurieren und danach vom System trennen wollen, muß der Speicher zunächst dekonfiguriert werden. Wenn für den Speicher auf der Platine jedoch das Speicher-Interleaving mit Speicher auf anderen Platinen aktiviert ist, kann der Speicher nicht dynamisch dekonfiguriert werden.

Ob das Speicher-Interleaving aktiviert ist, können Sie mit dem Befehl prtdiag oder cfgadm überprüfen.

Workaround: Fahren Sie das System herunter, bevor Sie an der Platine Wartungsarbeiten vornehmen, und starten Sie es danach neu. Sollen zukünftig DR-Operationen mit der CPU-/Speicherplatine möglich sein, muß die NVRAM-Eigenschaft memory-interleave auf min gesetzt sein. Weitere relevante Informationen zum Speicher-Interleaving finden Sie unter "Speicher-Interleaving nach einem schwerwiegenden Zurücksetzen falsch eingestellt (Bug-ID 4156075)".

DR: Dekonfiguration einer CPU-/Speicherplatine mit permanentem Speicher ist nicht möglich (Bug-ID 4210280)

Wenn Sie eine CPU-Platine mit Hauptspeicher oder eine reine Hauptspeicherplatine dekonfigurieren und danach vom System trennen wollen, muß der Speicher zunächst dekonfiguriert werden. Manche Speicherbereiche können zur Zeit jedoch nicht neu zugewiesen werden. Solche Speicherbereiche sind permanent.

Permanenter Speicher auf einer Platine ist in der cfgadm-Statusanzeige als "permanent" gekennzeichnet:


# cfgadm -s cols=ap_id:type:info
Ap_Id Type Information
ac0:bank0 memory slot3 64Mb base 0x0 permanent
ac0:bank1 memory slot3 empty
ac1:bank0 memory slot5 empty
ac1:bank1 memory slot5 64Mb base 0x40000000

In diesem Beispiel befindet sich auf der Platine in Steckplatz 3 permanenter Speicher. Die Platine kann also nicht entfernt werden.

Workaround: Fahren Sie das System herunter, bevor Sie an der Platine Wartungsarbeiten vornehmen, und starten Sie es danach neu.

cfgadm Disconnect schlägt fehl, wenn cfgadm-Befehle gleichzeitig ausgeführt werden (Bug-ID 4220105)

Wenn für eine Platine ein cfgadm-Prozeß läuft, schlägt der Versuch, gleichzeitig eine zweite Platine zu trennen, fehl.

Eine cfgadm Disconnect-Operation schlägt fehl, wenn ein weiterer cfgadm-Prozeß bereits für eine andere Platine läuft. Die folgende Meldung wird ausgegeben:


cfgadm: Hardware specific failure: disconnect failed: nexus
error during detach: Adresse

Workaround: Führen Sie immer nur eine cfgadm-Operation aus. Wenn eine cfgadm-Operation für eine Platine läuft, warten Sie, bis diese abgeschlossen ist, bevor Sie eine cfgadm Disconnect-Operation für eine zweite Platine starten.

Drain und/oder Detach sind bei Sun Enterprise Server-Platinen mit QFE-Karten nicht möglich (Bug-ID 4231845)

Wenn ein Server als Boot-Server für Clients der Intel Plattform konfiguriert wird, die auf Solaris 2.5.1 basieren, laufen mehrere rpld-Jobs, unabhängig davon, ob die Geräte benutzt werden. Aufgrund dieser aktiven Verweise können solche Geräte mit DR-Operationen nicht abgehängt werden.

Workaround: Führen Sie eine DR Detach-Operation durch:

  1. Entfernen Sie das Verzeichnis /rplboot, oder benennen Sie es um.

  2. Fahren Sie die NFS-Dienste mit dem folgenden Befehl herunter:


    # sh /etc/init.d/nfs.server stop
    

  3. Führen Sie die DR Detach-Operation aus.

  4. Starten Sie die NFS-Dienste mit dem folgenden Befehl:


    # sh /etc/init.d/nfs.server start