Questo capitolo descrive i problemi che riguardano in modo specifico i server Sun di fascia media e alta. Gli attuali server Sun fanno parte della famiglia di sistemi Sun Fire. I server precedenti fanno parte della famiglia di sistemi Sun Enterprise.
Le note su SunVTS (Sun Validation Test Suite) sono ora disponibili come documento separato e possono essere consultate sul sito http://sun.com.
Questa sezione descrive i principali problemi di riconfigurazione dinamica che si possono verificare a livello di dominio sui seguenti sistemi Sun Fire di fascia alta che eseguono Solaris 10:
Sun Fire 25K
Sun Fire 20K
Sun Fire 15K
Sun Fire 12K
Per informazioni sui problemi di DR relativi a Sun Management Services, vedere il documento SMS Release Notes per la versione di SMS in uso sul sistema.
Questa informazione si applica esclusivamente alla riconfigurazione dinamica (DR) eseguita sui server elencati in questa sezione. Per informazioni sulla riconfigurazione dinamica in altri server, vedere le Note sulla versione o le Note sul prodotto o le sezioni che descrivono tali server.
I seguenti problemi software e hardware si riferiscono ai sistemi Sun Fire di fascia alta.
Il collegamento tra un sistema con MMF Sun GigaSwift Ethernet opzione X1151A e alcuni switch CISCO non funziona correttamente. Il problema si verifica quando si cerca di eseguire un'operazione di DR su un sistema di questo tipo collegato a uno dei seguenti switch:
Switch CISCO WS-c4003 (f/w: software WS-C4003, versione NmpSW: 4.4(1))
Switch CISCO WS-c4003 (f/w: software WS-C4003, versione NmpSW: 7.1(2))
Switch CISCO WS-c5500 (f/w: software WS-C5500, versione McpSW: 4.2(1) e NmpSW: 4.2(1))
Il problema non si verifica con lo switch CISCO 6509.
Soluzione. Usare un altro switch. In alternativa, richiedere a Cisco una patch per gli switch sopra elencati.
Questa sezione descrive i problemi principali che si possono verificare nelle operazioni di DR sui seguenti sistemi Sun Fire di fascia media:
Sun Fire E6900
Sun Fire E4900
Sun Fire E6800
Sun Fire E4810
Sun Fire E4800
Sun Fire E3800
Questa informazione si applica esclusivamente alla riconfigurazione dinamica (DR) eseguita sui server elencati in questa sezione. Per informazioni sulla riconfigurazione dinamica in altri server, vedere le Note sulla versione o le Note sul prodotto o le sezioni che descrivono tali server.
La Tabella 3–1 mostra le possibili combinazioni tra il software Solaris e il firmware del controller di sistema per i sistemi Sun Fire di fascia media in relazione alle operazioni di DR.
Per utilizzare al meglio le funzioni e le correzioni più aggiornate del firmware, eseguire sul proprio sistema Sun Fire la versione più recente del firmware SC. Per informazioni aggiornate sulle patch, vedere http://sunsolve.sun.com.
Piattaforma |
Versione di Solaris |
Firmware SC minimo |
---|---|---|
Sun Fire E6900/E4900 con UltraSPARC IV+ |
Solaris 10 3/05 HW1 (versione limitata) o Solaris 10 1/06 |
5.19.0 |
E6900/E4900 senza UltraSPARC IV+ |
Solaris 9 4/04 |
5.16.0 |
Sun Fire 6800/4810/4800/3800 |
Solaris 9 4/04 |
5.16.0 |
Sun Fire 6800/4810/4800/3800 |
Solaris 9 |
5.13.0 |
Per aggiornare il firmware di un sistema midrange Sun Fire è possibile connettersi a un server FTP o HTTP in cui siano memorizzate le immagini del firmware. Per maggiori informazioni, vedere i file README e Install.info. Questi file sono inclusi nelle versioni del firmware eseguite all'interno del dominio. È possibile scaricare le patch Sun da http://sunsolve.sun.com.
Questa sezione descrive i bug principali che si possono verificare nelle operazioni di riconfigurazione dinamica.
Se un processo tiene aperto un dispositivo di rete, non è possibile eseguire operazioni di DR che coinvolgano quel dispositivo. I daemon e i processi che mantengono un conteggio dei riferimenti impediscono il completamento delle operazioni di DR.
Soluzione. Come superutente, eseguire le seguenti operazioni:
Rimuovere o rinominare la directory /rplboot.
Arrestare i servizi NFS.
# sh /etc/init.d/nfs.server stop |
Arrestare i servizi del server di avvio.
# sh /etc/init.d/boot.server stop |
Eseguire l'operazione di scollegamento DR.
Riavviare i servizi NFS.
# sh /etc/init.d/nfs.server start |
Riavviare i servizi del server di avvio.
# sh /etc/init.d/boot.server start |
Questa sezione descrive i problemi che riguardano le seguenti funzioni del server Sun Enterprise 10000:
Requisiti per il processore di servizio
Riconfigurazione dinamica (DR)
Reti interdominio (IDN)
Sistema operativo Solaris nei domini di Sun Enterprise 10000
Solaris 10 può essere eseguito in singoli domini all'interno di un sistema Sun Enterprise 10000. Tuttavia, il processore di servizio (SSP) del server Sun Enterprise 10000 non è supportato da questa versione.
Per il supporto di Solaris 10 è richiesto il software SSP 3.5 sul processore di servizio (SSP). Installare il software SSP 3.5 sul processore di servizio. A questo punto è possibile installare o aggiornare Solaris 10 in un dominio Sun Enterprise 10000.
Il software SSP 3.5 è richiesto anche per poter configurare correttamente il dominio per DR 3.0.
Questa sezione descrive diversi problemi relativi alle operazioni di riconfigurazione dinamica nei domini Sun Enterprise 10000.
A partire da Solaris 9 12/03, è necessario utilizzare DR 3.0 nei domini Sun Enterprise 10000 che utilizzano il sistema operativo Solaris. DR 3.0 si riferisce alla funzionalità che utilizza i comandi seguenti sull'SSP per eseguire le operazioni di riconfigurazione dinamica:
addboard
moveboard
deleteboard
showdevices
rcfgadm
Il comando cfgadm può essere utilizzato sui domini per ottenere informazioni sullo stato delle schede. DR 3.0 può inoltre interfacciarsi con RCM (Reconfiguration Coordination Manager) per coordinare le operazioni di DR con altre applicazioni eseguite nel dominio.
Per maggiori informazioni su DR 3.0, vedere il manuale Sun Enterprise 10000 Dynamic Reconfiguration User Guide.
In questa versione di Solaris, la funzionalità di DR non disconnette automaticamente i processi utente dalle CPU che vengono scollegate. È perciò necessario eseguire questa operazione prima di iniziare una sequenza di scollegamento. L'operazione di svuotamento non riesce se il processo rileva la presenza di CPU con processi associati.
Se un processo tiene aperto un dispositivo di rete, non è possibile eseguire operazioni di DR che coinvolgano quel dispositivo. I daemon e i processi che mantengono un conteggio dei riferimenti impediscono il completamento delle operazioni di DR.
Soluzione. Come superutente, eseguire le seguenti operazioni:
Rimuovere o rinominare la directory /rplboot.
Arrestare i servizi NFS.
# sh /etc/init.d/nfs.server stop |
Arrestare i servizi del server di avvio.
# sh /etc/init.d/boot.server stop |
Eseguire l'operazione di scollegamento DR.
Riavviare i servizi NFS.
# sh /etc/init.d/nfs.server start |
Riavviare i servizi del server di avvio.
# sh /etc/init.d/boot.server start |
Perché un dominio possa entrare a far parte di una rete interdominio (IDN), occorre che tutte le schede con una memoria attiva in quel dominio possiedano almeno una CPU attiva.
Prima di eseguire il comando boot net dal prompt della PROM di OpenBoot (OK), verificare che la variabile local-mac-address? sia impostata su false. Questa è l'impostazione predefinita. Se la variabile è impostata su true, occorre verificare che questo valore sia appropriato per la configurazione locale.
La variabile local-mac-address? impostata su true può impedire l'avvio corretto del sistema attraverso la rete.
In una finestra netcon, usare il comando seguente al prompt della PROM OpenBoot per visualizzare i valori delle relative variabili:
OK printenv |
Ripristinare la variabile local-mac-address? sull'impostazione predefinita. Usare il comando setenv:
OK setenv local-mac-address? false |
Questa sezione contiene informazioni aggiornate sulla funzionalità di riconfigurazione dinamica (DR) per i seguenti server midrange che utilizzano Solaris 10:
Sun Enterprise 6x00
Sun Enterprise 5x00
Sun Enterprise 4x00
Sun Enterprise 3x00
Per maggiori informazioni sulla riconfigurazione dinamica dei server Sun Enterprise, vedere il manuale Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems. Solaris 10 include il supporto per tutte le schede CPU/memoria e per la maggior parte delle schede di I/O dei sistemi citati nell'elenco precedente.
Prima di procedere, verificare che il sistema supporti la riconfigurazione dinamica. Se il sistema è di produzione meno recente, viene generato il messaggio seguente sulla console o nei log della console. Questi sistemi non sono adatti per la riconfigurazione dinamica.
Hot Plug not supported in this system |
Le seguenti schede di I/O non sono attualmente supportate:
Tipo 2 (grafica)
Tipo 3 (PCI)
Tipo 5 (grafica e SOC+)
Questa sezione contiene informazioni generali sul software di DR.
Per abilitare la riconfigurazione dinamica, è necessario impostare due variabili nel file /etc/system. È inoltre necessario impostare un'ulteriore variabile per abilitare la rimozione delle schede CPU/memoria. Procedere come segue:
Accedere al sistema come superutente.
Aprire con un editor il file /etc/system e aggiungervi le righe seguenti:
set pln:pln_enable_detach_suspend=1 set soc:soc_enable_detach_suspend=1 |
Per abilitare la rimozione di una scheda CPU/memoria, aggiungere al file questa riga:
set kernel_cage_enable=1 |
L'impostazione di questa variabile consente l'operazione di deconfigurazione della memoria.
Riavviare il sistema per applicare le modifiche.
Per iniziare la prova di quiescenza eseguire il comando seguente:
# cfgadm -x quiesce-test sysctr10:slot number |
Sui sistemi di grandi dimensioni, la prova di quiescenza può durare fino a un minuto. Per tutto questo periodo, qualora cfgadm non individui driver incompatibili, non viene visualizzato nessun messaggio.
Il tentativo di connettere una scheda inclusa nell'elenco delle schede disabilitate può generare un messaggio di errore:
# cfgadm -c connect sysctrl0:slotnumber cfgadm: Hardware specific failure: connect failed: board is disabled: must override with [-f][-o enable-at-boot] |
Per modificare lo stato di disabilitazione della scheda, sono disponibili due opzioni:
Usare il flag di forzatura (-f)
# cfgadm -f -c connect sysctrl0:slot number |
Usare l'opzione di abilitazione (-o enable-at-boot)
# cfgadm -o enable-at-boot -c connect sysctrl0:slot number |
Per rimuovere tutte le schede dall'elenco delle schede disabilitate, scegliere una di queste due opzioni in base al prompt da cui si esegue il comando:
Dal prompt di superutente, digitare:
# eeprom disabled-board-list= |
Dal prompt della PROM OpenBoot, digitare:
OK set-default disabled-board-list |
Per maggiori informazioni sull'impostazione disabled-board-list, vedere la sezione “Specific NVRAM Variables” nel manuale Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems. Questo manuale fa parte della documentazione di questa versione di Solaris.
Nella documentazione di questa versione sono incluse informazioni sull'impostazione disabled-memory-list della PROM OpenBoot. Vedere la sezione “Specific NVRAM Variables” nel manuale Platform Notes: Sun Enterprise 3x00, 4x00, 5x00, and 6x00 Systems, incluso nella documentazione di Solaris per l'hardware Sun.
Se occorre scaricare uno o più driver “detach-unsafe”, usare il comando modinfo per identificare gli ID dei moduli dei driver. Questi ID potranno quindi essere utilizzati nel comando modunload per scaricare i driver “detach-unsafe”.
Rimuovere la scheda dal sistema al più presto se durante una sequenza di connessione DR compare il seguente messaggio di errore:
cfgadm: Hardware specific failure: connect failed: firmware operation error |
La scheda non ha superato il test automatico e la sua rimozione può evitare possibili errori di riconfigurazione durante il riavvio successivo.
L'insuccesso del test automatico non consente ulteriori operazioni. Di conseguenza, per riprovare subito a eseguire l'operazione non riuscita, è necessario rimuovere e quindi reinserire la scheda.
L'elenco seguente è costantemente soggetto a modifiche.
Se un processo tiene aperto un dispositivo di rete, non è possibile eseguire operazioni di DR che coinvolgano quel dispositivo. I daemon e i processi che mantengono un conteggio dei riferimenti impediscono il completamento delle operazioni di DR.
Soluzione. Come superutente, eseguire le seguenti operazioni:
Rimuovere o rinominare la directory /rplboot.
Arrestare i servizi NFS.
# sh /etc/init.d/nfs.server stop |
Arrestare i servizi del server di avvio.
# sh /etc/init.d/boot.server stop |
Eseguire l'operazione di scollegamento DR.
Riavviare i servizi NFS.
# sh /etc/init.d/nfs.server start |
Riavviare i servizi del server di avvio.
# sh /etc/init.d/boot.server start |