Solaris 8 2/02 Versionshinweise zu Sun - Hardware - Ergänzungen

Kapitel 5 Offene Punkte für Sun Fire 6800/4810/4800/3800 Systeme

Dieses Kapitel beschreibt offene Punkte zur Verwendung der Solaris Betriebsumgebung auf Sun Fire 6800/4810/4800/3800 Systemen.

Sun Fire 6800/4810/4800/3800 Systeme

Dieser Abschnitt enthält Informationen zur Verwendung der Solaris Betriebsumgebung.

Anzeigen von Systemkonfigurationsinformationen

Der Befehl prtdiag der Solaris Betriebsumgebung zeigt Systemkonfigurationsparameter an. Die im Handbuch zur Hardware-Plattform von Sun beschriebenen Informationen zu diesem Befehl und für diese BS-Version sind inkorrekt. Es folgen die korrekten Informationen.

Der Befehl prtdiag (1M) der Solaris Betriebsumgebung zeigt für die Domain Ihres Sun Fire 6800/4810/4800/3800 Systems folgende Informationen an:

Dynamische Rekonfiguration auf Sun Fire 6800/4810/4800/3800 Systemen

Diese Version von Solaris bietet Unterstützung für die dynamische Rekonfiguration (DR). In diesem Abschnitt sind offene Punkte bezüglich der DR auf Sun Fire 6800/4810/4800/3800 Systemen zum Zeitpunkt dieser Version aufgeführt.


nur -

Informationen zur Systemcontroller-Firmware, die die DR-Funktionalität enthält, finden Sie in den Sun Fire 6800/4810/4800/3800 Systems Software Release Notes im Rahmen der 5.12.6 Firmware-Version. Diese Firmware und verwandte Dokumente sind im SunSolve Patch 112127-02 enthalten, der auf der SunSolve Website (http://sunsolve.Sun.com) verfügbar ist.


Diese Versionshinweise für die dynamische Rekonfiguration (DR) auf Sun Fire 6800, 4810, 4800 und 3800 Systeme befassen sich mit folgenden Themen:

Systemspezifischer DR-Support

Den systemspezifischen DR-Support für 6800/4810/4800/3800 Systeme können Sie mit dem Befehl cfgadm anzeigen. Systemkarten werden als Klasse "sbd", CompactPCI (cPCI) Karten als Klasse "pci" ausgewiesen. Wenn Sie die DR über die cfgadm Schnittstelle verwenden, sehen Sie auch andere DR-Klassen.

Weitere Informationen zu systemspezifischen Problemen mit DR finden Sie unter "Bekannte Fehler der Dynamic Reconfiguration".

Um Klassen anzuzeigen, die mit Anschlusspunkten assoziiert sind, führen Sie als superuser folgende Befehlsfolge aus:

# cfgadm -s "cols=ap_id:class"

Dynamische Anschlusspunkte können Sie auch mit dem Befehl cfgadm und der Option -a auflisten. Um die Klasse eines bestimmten Anschlusspunkts zu bestimmen, fügen Sie den Punkt als Argument zum oben stehenden Befehl hinzu.

Installationsanweisungen für die Dynamic Reconfiguration-Software

Die folgende Software unterstützt DR auf einem Sun Fire System: Version 8 2/02 der Solaris Betriebsumgebung und Version 5.12.6 der System-Firmware.

Außerdem können Sie wahlweise Sun Management Center (SunMC) installieren. Ausführliche Anweisungen dazu finden Sie im Sun Management Center 3.0-Ergänzungssoftware für die Systeme Sun Fire 6800, 4810, 4800 und 3800.

Upgrade der System-Firmware

Das Upgrade der Sun Fire System-Firmware erfolgt via FTP- oder HTTP-Verbindung über einen FTP- bzw. HTTP-Server, auf dem das Firmware-Abbild gespeichert ist. Weitere Informationen finden Sie im Sun Fire 6800/4810/4800/3800 Systems Platform Administration Manual.


nur -

Zusätzliche Informationen zum Installieren des Firmware-Patches finden Sie in den mitgelieferten Dateien README und Install.info.



Caution - Caution -

Aktualisieren Sie neben der Firmware für den System-Controller unbedingt auch die für alle CPU/Speicherplatinen und E/A-Einheiten. Wenn sich die Firmware Ihrer CPU/Speicherplatinen und E/A-Einheiten von der des System-Controllers unterscheidet, können Sie Ihre Domains vielleicht nicht booten.


So führen Sie ein Upgrade Ihrer System-Firmware durch:
  1. Richten Sie den FTP- oder HTTP-Server ein.

    Informationen dazu finden Sie in Anhang B im Sun Fire 6800/4810/4800/3800 Systems Platform Administration Manual (Teilenummer 805-7373-13).

  2. Laden Sie die 5.12.6 Firmware herunter.

    Diese Firmware und damit zusammenhängende Informationen sind im SunSolve Patch 112127-02 enthalten, den Sie über folgende Website herunterladen können

    http://sunsolve.Sun.COM/pub-cgi/show.pl?target=patches/patch-access

  3. Kopieren Sie den Patch auf den FTP- oder HTTP-Server mit einem Befehl wie dem folgenden:

    # cp /patch_location/* /export/ftp/pub/5.12.6

  4. Stellen Sie eine Verbindung zur Konsole des System-Controllers (serieller Anschluss) her, um das System während des Firmware-Upgrades zu überwachen (Schritt 6).

    Der Prompt für den System-Controller lautet:

    scHostname:SC>

  5. Fahren Sie alle Domains herunter, indem Sie die Solaris Betriebsumgebung anhalten.

    Der Schlüsselschalter bleibt für diese Domains in der Position on.

  6. Setzen Sie in jeder Domain, die Sie über Schritt 5 deaktivieren, die Schlüsselschalter-Position auf standby:

    scHostname:A> setkeyswitch standby

  7. Prüfen Sie, ob alle CPU/Speicherplatinen und E/A-Einheiten eingeschaltet sind, indem Sie den Befehl showboards auf dem System-Controller in der Plattform-Shell ausführen:

    scHostname:SC> showboards

  8. Schalten Sie alle deaktivierten CPU/Speicherplatinen und E/A-Einheiten mithilfe des Befehls poweron auf dem System-Controller in der Plattform-Shell ein:

    scHostname:SC> poweron Komponenten_namen

  9. Führen Sie das Upgrade der Firmware mit dem Befehl flashupdate auf dem System-Controller in der Plattform-Shell durch.


    Caution - Caution -

    Schalten Sie das System während der Ausführung dieses Schrittes nicht aus bzw. führen Sie keinen Neustart durch.


    Verwenden Sie die für das URL-Protokoll in Frage kommende Befehlssyntax:

    scHostname:SC> flashupdate -f URL all

    Der Befehl flashupdate startet den System-Controller neu und führt das Upgrade der CPU/Speicherplatinen und E/A-Einheiten, scapp und RTOS, durch.


    nur -

    Wenn Sie scapp 5.12.5 oder höher und RTOS 18 oder höher ausführen, wird nur dann ein Upgrade von scapp und RTOS durchgeführt, wenn sich das zu installierende vom installierten Abbild unterscheidet.


  10. Wenn der System-Controller dann wieder erfolgreich gestartet wurde, stellen Sie eine Verbindung zu jeder Domain-Konsole her und deaktivieren Sie alle CPU/Speicherplatinen und E/A-Einheiten, indem Sie die Schlüsselschalter-Position auf off einstellen:

    scHostname:A> setkeyswitch off

  11. Prüfen Sie, ob alle CPU/Speicherplatinen und E/A-Einheiten eingeschaltet sind, indem Sie den Befehl showboards auf dem System-Controller in der Plattform-Shell ausführen:

    scHostname:SC> showboards

  12. Schalten Sie alle noch aktiven CPU/Speicherplatinen und E/A-Einheiten mithilfe des Befehls poweroff auf dem System-Controller in der Plattform-Shell aus:

    scHostname:SC> poweroff Komponenten_namen

  13. Rufen Sie alle Domains auf, indem Sie die Schlüsselschalter-Position auf on einstellen:

    scHostname:A> setkeyswitch on

  14. Wenn alle Domains aufgerufen wurden, aktualisieren Sie die Konfigurationssicherung des System-Controllers mithilfe des Befehls dumpconfig:

    scHostname:SC> dumpconfig -f URL

    wobei URL für das FTP-Protokoll steht.

Bekannte DR-Einschränkungen

Dieser Abschnitt beschreibt bekannte DR-Softwareeinschränkungen auf Sun Fire 6800, 4810, 4800 und 3800 Systemen.

Allgemeine DR-Einschränkungen

Beschränkungen bezüglich CompactPCI

Verfahren zum Online- bzw. Offline-Schalten einer cPCI-Netzwerkschnittstelle (IPMP)

So nehmen Sie eine cPCI-Netzwerkschnittstelle (IPMP) offline und entfernen sie:
  1. Rufen Sie Gruppennamen, Testadresse und Schnittstellenindex ab, indem Sie folgenden Befehl eingeben.

    # ifconfig Schnittstelle

    Zum Beispiel ifconfig hme0

  2. Verwenden Sie den Befehl if_mpadm(1M) wie folgt:

    # if_mpadm -d Schnittstelle

    Dadurch wird die Schnittstelle offline genommen und die Failover-Adresse an eine andere aktive Schnittstelle der Gruppe übergeben. Wenn sich die Schnittstelle bereits im Failed-Status befindet, stellen Sie mit diesem Schritt lediglich sicher, dass die Schnittstelle offline ist.

  3. (Optional) Deaktivieren (Unplumb) Sie die Schnittstelle.

    Dieser Schritt ist nur erforderlich, wenn Sie die Schnittstelle mithilfe von DR später automatisch neu konfigurieren möchten.

  4. Entfernen Sie die physikalische Schnittstelle.

    Genaue Informationen finden Sie in der Man-Page cfgadm(1M) und im Sun Fire 6800, 4810, 4800 and 3800 Systems Dynamic Reconfiguration User Guide.

So hängen Sie eine cPCI-Netzwerkschnittstelle (IPMP) ein und bringen Sie online:
  1. Installieren Sie die physikalische Schnittstelle.

    Genaue Informationen finden Sie in der Man-Page cfgadm(1M) und im Sun Fire 6800, 4810, 4800 and 3800 Systems Dynamic Reconfiguration User Guide.

Nachdem die physikalische Schnittstelle installiert ist, wird sie mit den Einstellungen der Hostname-Konfigurationsdatei (/etc/hostname.Schnittstelle, wobei Schnittstelle einen Wert wie hme1 oder qfe2 darstellt) automatisch konfiguriert.

Dadurch wird der Daemon in.mpathd zur Fortsetzung seiner Diagnose und der Erkennung von Reparaturen veranlasst. Schließlich bewirkt in.mpathd, dass die ursprünglichen IP-Adressen wieder dieser Schnittstelle zugeordnet werden. Die Schnittstelle sollte jetzt online und für die Verwendung unter IPMP bereit sein.


nur -

Wenn die Schnittstelle nicht deaktiviert (unplumb) und vor einem Aushängvorgang in den Status OFFLINE versetzt wurde, würde sie durch den hier beschriebenen Installationsvorgang automatisch konfiguriert. Um die Schnittstelle auf den Status ONLINE zurückzusetzen und ihre IP-Adresse nach der physikalischen Installation wieder zuzuweisen, geben Sie folgenden Befehl ein: if_mpadm -r Schnittstelle.


Ruhezustand des Betriebssystems

Dieser Abschnitt befasst sich mit permanentem Speicher und die Voraussetzungen für einen Ruhezustand des Betriebssystems beim Zurücksetzen der Konfiguration eines Systems, das über permanenten Speicher verfügt.

Um schnell herauszufinden, ob eine Platine über permanenten Speicher verfügt, führen Sie als superuser folgenden Befehl aus:

# cfgadm -av | grep permanent

Das System antwortet dann mit einer Ausgabe ähnlich der folgenden, die die Systemplatine 0 (Null) beschreibt:

N0.SB0::memory connected configured ok base address 0x0, 4194304 KBytes total, 668072 KBytes permanent

Permanenter Speicher ist der Ort, an dem der Solaris Kernel und seine Daten abgelegt sind. Der Kernel kann nicht auf die gleiche Art und Weise aus dem Speicher freigegeben werden wie Benutzerprozesse Speicher auf anderen Platinen freigeben, wenn Sie ein Paging zum Swap-Gerät durchführen. Stattdessen verwendet cfgadm für die Freigabe von Speicher die Technik des Kopierens und Umbenennens.

Der erste Schritt in einer Kopieren/Umbenennen-Aktion ist das Stoppen aller Speicheraktivitäten auf dem System. Dazu werden alle E/A-Operationen und die Thread-Aktivität angehalten. Diesen Vorgang bezeichnet man auch als quiescence (Ruhezustand). Dabei wird das System praktisch eingefroren und reagiert nicht auf externe Events wie Netzwerkpakete. Die Dauer des Ruhezustands hängt von zwei Faktoren ab: wie viele E/A-Geräte und Threads gestoppt werden müssen und wie viel Speicher kopiert werden muss. Üblicherweise bestimmt die Anzahl der E/A-Geräte die erforderliche Ruhezustands-Zeit, da sie angehalten und wieder gestartet werden müssen. Ein normaler Ruhezustands-Status dauert im Allgemeinen länger als 2 Minuten.

Da ein Ruhezustand größere Auswirkungen zur Folge hat, fordert cfgadm vor dem Start eine Bestätigung an. Wenn Sie Folgendes eingeben:

# cfgadm -c unconfigure N0.SB0

Antwortet das System mit einem Bestätigungsprompt:

System may be temporarily suspended, proceed (yes/no)?

Wenn Sie SunMC für die DR-Operation verwenden, wird der Prompt in einem Popup-Fenster angezeigt.

Geben Sie yes ein, um zu bestätigen, dass die Auswirkungen des Ruhezustands akzeptabel sind und fahren Sie fort.

Software-Fehler bei der Dynamic Reconfiguration

Dieser Abschnitt enthält eine Übersicht und Sun Bug-ID-Nummern der wichtigsten Fehler, die beim Testen der DR aufgetreten sind. Diese Liste ist nicht abschließend.

Bekannte Fehler der Dynamic Reconfiguration

cryptorand wurde nach Entfernen der CPU-Platine mithilfe der Dynamic Reconfiguration beendet (Bug-ID 4456095)

Beschreibung: Wenn ein System den Prozess cryptorand ausführt, der im SUNWski Package enthalten ist, verursacht ein Zurücksetzen der Konfiguration, wie sie beim Entfernen einer CPU/Speicherplatine (SB) abläuft, dass cryptorand mit in /var/adm/messages aufgezeichneten Meldungen beendet wird. Diese Aktion verweigert sicheren Sub-Systemen Dienste zur Zuweisung zufälliger Nummern. Jeglicher, beim Start von cryptorand vorhandene Speicher sollte konfiguriert bleiben.

Der cryptorand Prozess weist /dev/random eine zufällige Nummer zu. Nachdem er gestartet wurde, hängt die Zeit, bis /dev/random verfügbar wird, davon ab, wieviel Speicher sich im System befindet. Es werden etwa 2 Minuten pro GB Speicher veranschlagt. Anwendungen, die /dev/random für die Zuweisung von zufälligen Nummern verwenden, werden vielleicht zeitweilig blockiert. cryptorand muss beim Hinzufügen einer CPU/Speicherplatine zu einer Domain nicht neu gestartet werden.

Lösung: Wenn eine CPU/Speicherplatine aus der Domain entfernt wird, starten Sie cryptorand erneut, indem Sie als superuser folgenden Befehl eingeben:

# sh /etc/init.d/cryptorand start

SBM verursacht manchmal einen Systemabsturz während DR-Operationen (Bug-ID 4506562)

Beschreibung: Es kann ein Systemabsturz auftreten, wenn ein Systemplatine mit CPUs entfernt wird, während der Solaris Bandwidth Manager (SBM) läuft.

Lösung: Installieren Sie den SBM nicht auf Systemen, die für DR-Tests verwendet werden und führen Sie keine DR-Operationen für CPU-Systemplatinen auf Systemen aus, auf denen SBM installiert ist.

DR hängt sich bei der Konfigurationsoperation mit IB-Platine mit vxdmpadm policy=check_all auf (Bug-ID 4509462)

Beschreibung: Eine DR-Konfigurationsoperation hängt sich bei einer IBx (E/A) Platine nach einigen erfolgreichen Wiederholungen auf. Diese Situation tritt auf, wenn die DR-Operation gleichzeitig mit dem DMP-Daemon ausgeführt wird, der die Richtlinie check_all mit einem Zeitintervall ausführt.

Lösung: Um eine gegenseitige Blockierung von DMP-Daemon und Systemplatine zu verhindern, geben Sie für die Ausführung von DR-Operationen folgenden Befehl ein. Durch ihn wird der DMP-Daemon gestoppt und neu gestartet.

# /usr/sbin/vxdmpadm stop restore

SCSI-Controller können mit DR nicht getrennt werden (Bug-ID 4446253)

Beschreibung: Wenn ein SCSI-Controller konfiguriert aber nicht aktiv ist, kann er mithilfe des DR-Befehls cfgadm(1M) nicht getrennt werden.

Lösung: Keine.

cfgadm_sbd Plugin in Multi-Threaded Umgebung ist beschädigt (Bug-ID 4498600)

Beschreibung: Wenn ein Multi-Threaded Client der Bibliothek cfgadm gleichzeitig mehrere sbd Anforderungen startet, hängt sich das System vielleicht auf.

Lösung: Keine. Zur Zeit gibt es keine Anwendungen, die eine Multithreaded-Verwendung der Bibliothek cfgadm implementieren.

DR-Operationen hängen sich nach einigen Schleifen auf, wenn gleichzeitig die CPU-Leistungsregelung ausgeführt wird (Bug-ID 4114317)

Beschreibung: Wenn gleichzeitig mehrere DR-Operationen ausgeführt werden oder wenn psradm gleichzeitig mit einer DR-Operation ausgeführt wird, kann sich das System wegen einer Mutex-Blockade aufhängen.

Lösung: Führen Sie DR-Operationen nacheinander aus (nur eine DR-Operation auf einmal) und warten Sie, bis sie beendet wurden, bevor Sie psradm oder eine neue DR-Operation starten.

Fehler beim SC-Konsolenbus, während SNMP aktiviert ist und DR Suite ausgeführt wird (Bug-ID 4485505)

Beschreibung: Manchmal wird bei SNMP get Operationen auf dem cpuModDescr Objekt eine Konsolenbus-Fehlermeldung ausgegeben. Dies geschieht selten und nur wenn SunMC ein System überwacht. Wenn die Meldung angezeigt wird, wird an SunMC unknown als Wert des cpuModDescr Objekts zurückgegeben.

Lösung: Die einzige Lösung ist, SunMC nicht zu verwenden. Allerdings tritt das Problem nur selten auf und deshalb kann diese Meldung ignoriert werden. Das einzige Risiko dabei ist, dass die SunMC GUI manchmal vielleicht den falschen Wert für cpuModDescr anzeigt.

System hängt sich vielleicht auf, wenn die Zeitverzögerung für send_mondo_set abläuft (Bug-ID 4518324)

Ein Sun Fire System hängt sich vielleicht auf, wenn eine oder mehrere CPU-Platinen während einer DR-Operation in die Gleichlaufpausierung geschaltet werden. Dieses Verfahren wird benötigt, um Platinen hinzuzufügen bzw. zu entfernen. Wenn ausstehende mondo Interrupts vorliegen und SC die Gleichlaufpausierung aus irgendeinem Grund nicht innerhalb des einsekündigen send_mondo timeout Zeitlimits ausführen kann, hängt sich das System auf.