Dieser Abschnitt enthält die aktuellsten Informationen über DR (Dynamic Reconfiguration)-Funktionen für folgende Mittelklasse-Server, auf denen Solaris 10 ausgeführt wird:
Sun Enterprise 6x00
Sun Enterprise 5x00
Sun Enterprise 4x00
Sun Enterprise 3x00
Weitere Informationen über die dynamische Rekonfiguration von Sun Enterprise Servern finden Sie im Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems. Die Solaris 10-Version unterstützt alle CPU-/Speicherkarten und die meisten E/A-Karten, die in den Systemen der vorhergehenden Liste enthalten sind.
Stellen Sie vor dem Fortfahren sicher, dass das System dynamische Rekonfiguration unterstützt. Wenn Ihr System ein älteres Modell ist, wird folgende Meldung auf der Konsole angezeigt oder im Konsolenprotokoll erfasst. Ein solches System ist nicht für die dynamische Rekonfiguration geeignet.
Hot Plug not supported in this system |
Folgende E/A-Karten werden derzeit nicht unterstützt:
Typ 2 (Grafik)
Typ 3 (PCI)
Typ 5 (Grafik und SOC+)
In diesem Abschnitt erhalten Sie allgemeine Software-Informationen zu DR.
Zum Aktivieren der dynamischen Rekonfiguration müssen Sie zwei Variablen in der Datei /etc/system festlegen. Außerdem müssen Sie eine zusätzliche Variable festlegen, um das Entfernen von CPU-/Speicherkarten zu aktivieren. Führen Sie folgende Schritte durch:
Melden Sie sich als Superuser an.
Fügen Sie der Datei /etc/system folgende Zeilen hinzu:
set pln:pln_enable_detach_suspend=1 set soc:soc_enable_detach_suspend=1 |
Um das Entfernen einer CPU-/Speicherkarte zu aktivieren, fügen Sie der Datei folgende Zeile hinzu:
set kernel_cage_enable=1 |
Das Setzen dieser Variablen aktiviert den Speicherdekonfigurationsvorgang.
Starten Sie das System neu, um die Änderungen zu übernehmen.
Der Stillstandtest wird mit folgendem Befehl gestartet:
# cfgadm -x quiesce-test sysctr10:slotnumber |
Auf einem großen System kann die Ausführung des Stillstandtests möglicherweise bis zu einer Minute dauern. Während dieses Zeitraums werden keine Meldungen angezeigt, wenn cfgadm keine inkompatiblen Treiber findet.
Der Versuch, eine Platine anzuschließen, die auf der Liste deaktivierter Platinen steht, erzeugt möglicherweise eine Fehlermeldung:
# cfgadm -c connect sysctrl0:slotNummer cfgadm: Hardware-spezifischer Fehler: connect fehlgeschlagen: Board deaktiviert: Außer Kraft setzen mit [-f][-o enable-at-boot] |
Zum Überschreiben der deaktivierten Bedingung stehen zwei Optionen zur Verfügung:
Verwenden des Force-Flags (Erzwingen; -f)
# cfgadm -f -c connect sysctrl0:slot Nummer |
Verwenden der Enable-Option (Aktivieren; -o enable-at-boot)
# cfgadm -o enable-at-boot -c connect sysctrl0:slot Nummer |
Um alle Platinen aus der Liste deaktivierter Platinen zu entfernen, wählen Sie in Abhängigkeit von der Eingabeaufforderung, an der Sie den Befehl eingeben möchten, eine der zwei Optionen:
Geben Sie an der Superuser-Eingabeaufforderung Folgendes ein:
# eeprom disabled-board-list= |
Geben Sie an der OpenBoot PROM-Eingabeaufforderung Folgendes ein:
OK set-default disabled-board-list |
Weitere Informationen über die disabled-board-list-Einstellung finden Sie im Abschnitt “Specific NVRAM Variables“ im Handbuch Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems. Dieses Handbuch ist Bestandteil der dieser Version beiliegenden Dokumentation.
Informationen über die OpenBoot PROM-Einstellung von disabled-memory-list finden Sie in den Unterlagen dieser Version. Siehe unter “Specific NVRAM Variables“ in den Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems in der Solaris on Sun-Hardware-Dokumentation.
Wenn Sie Detach/Unsafe-Treiber aus dem Speicher entfernen müssen, verwenden Sie den Befehl modinfo, um die Modul-IDs der Treiber zu ermitteln. Die Modul-IDs können Sie dann mit dem Befehl modunload zum Entfernen der Detach/Unsafe-Treiber aus dem Speicher verwenden.
Entfernen Sie die Platine so schnell wie möglich aus dem System, wenn folgende Fehlermeldung während einer DR-Anschlusssequenz angezeigt wird:
cfgadm: Hardware-spezifischer Fehler: Verbindungsfehler: firmware operation error |
Bei dieser Platine ist der Selbsttest fehlgeschlagen. Das Entfernen der Platine verhindert mögliche Rekonfigurationsfehler, die während des nächsten Neustarts auftreten können.
Der fehlgeschlagene Selbstteststatus lässt keine weiteren Vorgänge zu. Deshalb müssen Sie die Platine zuerst ausbauen und dann erneut einsetzen, wenn Sie den fehlgeschlagenen Vorgang sofort wiederholen möchten.
Die folgende Liste kann sich jederzeit ändern.
Wenn ein Prozess ein Netzwerkgerät geöffnet hält, schlägt jeder DR-Vorgang fehl, an dem dieses Gerät beteiligt ist. Dämonen und Prozesse, die Referenzzähler führen, hindern DR-Vorgänge am Abschluss.
Abhilfemaßnahme: Führen Sie als Superuser folgende Schritte durch:
Entfernen Sie das Verzeichnis /rplboot oder benennen Sie es um.
Fahren Sie die NFS-Dienste herunter.
# sh /etc/init.d/nfs.server stop |
Fahren Sie die Boot-Server-Dienste herunter.
# sh /etc/init.d/boot.server stop |
Führen Sie den DR-Trennvorgang durch.
Starten Sie die NFS-Dienste neu.
# sh /etc/init.d/nfs.server start |
Starten Sie die Boot-Server-Dienste neu.
# sh /etc/init.d/boot.server start |
Das Speicher-Interleaving befindet sich in einem fehlerhaften Zustand, wenn ein Sun Enterprise5 x500-Server nach einem schwer wiegenden Zurücksetzen neu gestartet wird. Alle nachfolgenden DR-Vorgänge schlagen fehl. Das Problem tritt nur auf Systemen auf, bei denen das Speicher-Interleaving auf min gesetzt ist.
Abhilfemaßnahme: Wählen Sie eine der folgenden Optionen:
Um das Problem zu beheben, setzen Sie das System an der OK-Eingabeaufforderung manuell zurück.
Um das Problem zu verhindern, setzen Sie die NVRAM-Eigenschaft memory-interleave auf max.
Die zweite Option sorgt dafür, dass der Speicher bei jedem Start des Systems verzahnt (interleaved) wird. Diese Option kann jedoch möglicherweise nicht akzeptabel sein, da eine Speicherkarte, die interleaved Speicher enthält, nicht dynamisch dekonfiguriert werden kann. Siehe Eine CPU-/Speicherkarte mit interleaved Speicher kann nicht dekonfiguriert werden (4210234).
Um eine CPU-Karte mit Speicher oder eine reine Speicherkarte zu dekonfigurieren und anschließend zu trennen, müssen Sie zuerst den Speicher dekonfigurieren. Wenn der Speicher der Karte jedoch mit Speicher auf anderen Karten im Interleave-Modus betrieben wird, kann der Speicher aktuell nicht dynamisch dekonfiguriert werden.
Speicher-Interleaving kann durch Verwendung eines der Befehle prtdiag oder cfgadm angezeigt werden.
Abhilfemaßnahme: Fahren Sie das System herunter, bevor Sie die Karte warten, und starten Sie anschließend erneut. Um zukünftige DR-Vorgänge an der CPU-/Speicherkarte zuzulassen, setzen Sie die NVRAM-Eigenschaft memory-interleave auf min. Eine damit in Zusammenhang stehende Diskussion zum Thema interleaved Speicher finden Sie unter Nach einem schwer wiegenden Zurücksetzen ist das Speicher-Interleaving falsch gesetzt (4156075) .
Um eine CPU-Karte mit Speicher oder eine reine Speicherkarte zu dekonfigurieren und anschließend zu trennen, müssen Sie zuerst den Speicher dekonfigurieren. Mancher Speicher kann jedoch derzeit nicht versetzt werden. Dieser Speicher wird als permanent betrachtet.
Permanenter Speicher auf einer Karte ist in der cfgadm-Statusanzeige als “permanent“ gekennzeichnet:
# cfgadm -s cols=ap_id:type:info Ap_Id Type Information ac0:bank0 memory slot3 64Mb base 0x0 permanent ac0:bank1 memory slot3 empty ac1:bank0 memory slot5 empty ac1:bank1 memory slot5 64Mb base 0x40000000 |
In diesem Beispiel ist die Karte in Slot3 mit permanentem Speicher ausgerüstet, weshalb sie nicht entfernt werden kann.
Abhilfemaßnahme: Fahren Sie das System herunter, bevor Sie die Karte warten, und starten Sie anschließend erneut.
Wird ein cfgadm-Prozess auf einer Karte ausgeführt, schlägt der Versuch, eine zweite Karte gleichzeitig zu trennen, fehl. Folgende Fehlermeldung wird angezeigt:
cfgadm: Hardware-spezifischer Fehler: disconnect failed: nexus error during detach:Adresse |
Abhilfemaßnahme: Führen Sie nur einen cfgadm-Vorgang gleichzeitig aus. Lassen Sie einen cfgadm-Vorgang, der auf einer Karte ausgeführt wird, zuerst abschließen, bevor Sie einen cfgadm-Trennvorgang auf einer zweiten Karte starten.