Supplemento alle note su Solaris 8 2/02 per hardware Sun

Capitolo 6 Problemi irrisolti nei sistemi Sun midrange

Questo capitolo contiene informazioni aggiornate per i sistemi Sun Enterprise che eseguono l'ambiente operativo Solaris 8, tra cui i sistemi Sun Enterprise 6500, 6000, 5500, 5000, 4500, 4000, 3500 e 3000.

L'ambiente operativo Solaris 8 supporta le schede di memoria/CPU e la maggior parte delle schede di I/O dei sistemi summenzionati.

Riconfigurazione dinamica dei sistemi Sun Enterprise 6x00, 5x00, 4x00 e 3x00

Queste note contengono le informazioni più recenti sulle funzionalità di riconfigurazione dinamica (DR) per i sistemi Sun Enterprise 6x00, 5x00, 4x00 e 3x00 in cui è in esecuzione l'ambiente operativo Solaris 8 2/02. Per informazioni più complete sulle funzioni di riconfigurazione dinamica per i server Sun Enterprise, vedere il manuale Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems.

L'ambiente operativo Solaris 8 2/02 include il supporto per le schede di memoria/CPU e per la maggior parte delle schede di I/O sui sistemi Sun Enterprise 6x00, 5x00, 4x00 e 3x00.

Hardware supportato

Prima di procedere, verificare che il sistema sia dotato di funzionalità di riconfigurazione dinamica (DR). Se il messaggio seguente compare sulla console o nei log di sistema, l'hardware in uso non è il più recente e non consente l'utilizzo delle funzioni DR.


Hot Plug not supported in this system

Le schede di I/O supportate sono elencate nella sezione relativa a "Solaris 8" nel sito Web:

http://sunsolve5.sun.com/sunsolve/Enterprise-dr

Le schede di I/O Tipo 2 (grafica), Tipo 3 (PCI) e Tipo 5 (grafica e SOC+) non sono correntemente supportate.

Note sul firmware

Array di dischi o unità interne FC-AL

Per gli array di dischi Sun StorEdge A5000 e i dischi interni FC-AL dei sistemi Sun Enterprise 3500, la versione del firmware deve essere ST19171FC 0413 o una versione successiva compatibile. Per maggiori informazioni, vedere la sezione relativa a "Solaris 8" nel sito seguente Web:

http://sunsolve5.sun.com/sunsolve/Enterprise-dr

Aggiornamenti della PROM per CPU e schede di I/O

Gli utenti del software Solaris 8 2/02 che desiderano utilizzare la funzione di riconfigurazione dinamica devono eseguire la PROM di CPU versione 3.2.22 (ID patch firmware 103346-xx) o o una versione successiva compatibile. Questo firmware è disponibile presso il sito Web. Vedere "Come ottenere il firmware".

Le vecchie versioni della PROM CPU potrebbero visualizzare il seguente messaggio durante il boot:


Firmware does not support Dynamic Reconfiguration


Caution - Caution -

La PROM CPU 3.2.16 e le versioni precedenti non visualizzano questo messaggio, anche se non supportano la riconfigurazione dinamica delle schede CPU/memoria.


  1. Per controllare la revisione della PROM corrente, digitare .version e banner al prompt ok.

    Verranno visualizzati messaggi simili ai seguenti:


    ok .version
    Slot  0 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26  iPOST 3.4.22 1999/xx/xx 19:31
    Slot  1 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26  iPOST 3.4.22 1999/xx/xx 19:31
    Slot  2 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  3 - I/O Type 4 FCODE 1.8.22 1999/xx/xx 19:27  iPOST 3.4.22 1999/xx/xx 19:31
    Slot  4 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  5 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  6 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  7 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot  9 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot 11 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot 12 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    Slot 14 - CPU/Memory OBP   3.2.22 1999/xx/xx 19:27  POST  3.9.22 1999/xx/xx 19:31
    ok banner
    16-slot Sun Enterprise E6500
    OpenBoot 3.2.22, 4672 MB memory installed, Serial #xxxxxxxx.
    Ethernet address 8:0:xx:xx:xx:xx, Host ID: xxxxxxxx.

Come ottenere il firmware

Per informazioni su come aggiornare il firmware, vedere la sezione relativa a "Solaris 8" nel seguente sito Web:

http://sunsolve5.sun.com/sunsolve/Enterprise-dr

In questo sito sono disponibili informazioni su come:

Se non si riesce a utilizzare il sito Web, chiedere aiuto al fornitore di servizi di supporto.

Note sul software

Attivazione della riconfigurazione dinamica

Nel file /etc/system, devono essere impostate due variabili per attivare la riconfigurazione dinamica e deve essere impostata un'ulteriore variabile per attivare la rimozione delle schede CPU/memoria.

  1. Collegarsi come superutente.

  2. Per attivare la riconfigurazione dinamica, modificare il file /etc/system e aggiungere le righe seguenti al file /etc/system:


    set pln:pln_enable_detach_suspend=1
    set soc:soc_enable_detach_suspend=1

  3. Per attivare la rimozione di una scheda CPU/memoria, aggiungere questa riga al file /etc/system:


    set kernel_cage_enable=1

    L'impostazione di questa variabile consente l'operazione di deconfigurazione della memoria.

  4. Riavviare il sistema per rendere attive le modifiche.

Test Quiesce

Su sistemi di grandi dimensioni il comando quiesce-test (cfgadm -x quiesce-test sysctrl0:slotnumero) può rimanere in esecuzione per un minuto circa. Per tutto questo periodo, qualora cfgadm non riesca ad individuare driver incompatibili, non viene visualizzato nessun messaggio. Si tratta del normale comportamento del comando.

Elenco delle schede disabilitate

Se una scheda si trova nell'elenco delle schede disabilitate, un tentativo di collegamento alla scheda può generare un messaggio di errore:


# cfgadm -c connect sysctrl0:slotnumero
cfgadm: Hardware specific failure: connect failed: board is
disabled: must override with [-f][-o enable-at-boot]

  1. Per escludere la condizione disabilitata, utilizzare l'indicatore di force (-f) oppure l'opzione enable (-o enable-at-boot) con il comando cfgadm:


    # cfgadm -f -c connect sysctrl0:slotnumero
    

    # cfgadm -o enable-at-boot -c connect sysctrl0:slotnumero
    

  1. Per rimuovere tutte le schede dall'elenco delle schede disabilitate, impostare la variabile disabled-board-list su un set null con il comando system:


    # eeprom disabled-board-list=
    

  1. Se ci si trova nel prompt OpenBoot, utilizzare questo comando invece di rimuovere tutte le schede dall'elenco delle schede disattivate:


    OK set-default disabled-board-list
    

    Per ulteriori informazioni sull'impostazione disabled-board-list, consultare la sezione "Specific NVRAM Variables" nelle Platform Notes: Sun Enterprise 3x00, 4x00, 5x00 and 6x00 Systems nel set di AnswerBook della collezione Solaris on Sun Hardware per la release corrente.

Elenco delle memorie disattivate

Per informazioni sull'impostazione OpenBoot PROM disabled-memory-list, consultare la sezione "Specific NVRAM Variables" nelle Platform Notes: Sun Enterprise 3x00, 4x00, 5x00 and 6x00 Systems nel set di AnswerBook della collezione Solaris on Sun Hardware per la release corrente.

Scaricamento dei driver Detach-Unsafe

Qualora sia necessario scaricare driver detach-unsafe, usare il comando modinfo(1M) per individuare gli ID di modulo dei driver. A questo punto è possibile utilizzare tali ID nel comando modunload(1M) per scaricare i driver detach-unsafe.

Memoria intercalata

Una scheda di memoria oppure una scheda CPU/memoria contenente memoria intercalata non può essere deconfigurata automaticamente.

Per determinare se la memoria è intercalata, utilizzare il comando prtdiag o il comando cfgadm.

Per consentire le operazioni DR sulle schede CPU/memoria, impostare la proprietà NVRAM memory-interleave su min.

Per informazioni correlate sulla memoria intercalata, vedere "Intercalaggio della memoria impostato non correttamente dopo un ripristino fatale (ID 4156075)" e "DR: Impossibile deconfigurare una scheda CPU/memoria che abbia memoria intercalata (ID 4210234)".

Errore dell'auto-test durante una sequenza di collegamento

Se l'errore "cfgadm: Hardware specific failure: connect failed: firmware operation error" viene visualizzato durante una sequenza di collegamento DR, rimuovere la scheda dal sistema non appena possibile. La scheda non ha superato l'auto-test e la rimozione della scheda evita i possibili errori di riconfigurazione che possono verificarsi nel corso del riavvio successivo.

Se si desidera riprovare immediatamente l'operazione non riuscita, è necessario prima rimuovere e reinserire la scheda, in quanto lo stato della scheda non consente ulteriori operazioni.

Problemi noti

L'elenco riportato di seguito è soggetto a modifiche in qualsiasi momento. Per informazioni sempre aggiornate sugli ultimi problemi rilevati e le patch disponibili, accedere al sito:

http://sunsolve5.sun.com/sunsolve/Enterprise-dr

cfgadm -v non funziona correttamente (ID 4149371)

Il test della memoria dovrebbe fornire indicazioni occasionali fino a quando è in esecuzione. Durante un test lungo, l'utente non può determinare facilmente che il sistema non si stia bloccando.

Soluzione: controllare l'andamento del sistema in un'altra shell o finestra, utilizzando vmstat(1M), ps(1), o altri comandi shell simili.

Intercalaggio della memoria impostato non correttamente dopo un ripristino fatale (ID 4156075)

L'intercalaggio della memoria viene lasciato in uno stato non corretto quando un server Sun Enterprise x500 viene riavviato dopo un Fatal Reset. Le successive operazioni DR non riusciranno. Il problema si verifica sui sistemi con l'intercalaggio della memoria impostato su min.

Soluzioni: ci sono due possibilità.

L'output vmstat è errato dopo aver configurato i processori (ID 4159024)

vmstat mostra un numero insolitamente alto di interrupt dopo aver configurato le CPU. Con vmstat sullo sfondo, il campo di interrupt assume una grandezza anormale (ma questo non è indice di un problema). Nell'ultima riga dell'esempio seguente, la colonna degli interrupt (in) ha un valore pari a 4294967216:


#  procs     memory            page            disk          faults      cpu
 r b w   swap  free  re  mf pi po fr de sr s6 s9 s1 --   in   sy   cs us sy id
 0 0 0 437208 146424  0   1  4  0  0  0  0  0  1  0  0   50   65   79  0  1 99
 0 0 0 413864 111056  0   0  0  0  0  0  0  0  0  0  0  198  137  214  0  3 97
 0 0 0 413864 111056  0   0  0  0  0  0  0  0  0  0  0  286  101  200  0  3 97
 0 0 0 413864 111072  0  11  0  0  0  0  0  0  1  0  0 4294967216 43 68 0 0 100

Soluzione: riavviare vmstat.

DR: Impossibile deconfigurare una scheda CPU/memoria che abbia memoria intercalata (ID 4210234)

Impossibile deconfigurare una scheda CPU/memoria che abbia memoria intercalata.

Per deconfigurare e successivamente scollegare una scheda CPU con una scheda di memoria oppure una scheda di sola memoria, è necessario deconfigurare prima la memoria. Tuttavia, se la memoria della scheda è intercalata con la memoria sulle altre schede, attualmente questa non può venire deconfigurata dinamicamente.

L'intercalaggio della memoria può essere visualizzato utilizzando i comandi prtdiag o cfgadm.

Soluzione: arrestare il sistema prima di riparare la scheda, quindi riavviare. Per consentire le future operazioni DR sulla scheda CPU/memoria, impostare la proprietà NVRAM memory-interleave su min. Vedere anche "Intercalaggio della memoria impostato non correttamente dopo un ripristino fatale (ID 4156075)" per spiegazioni dettagliate sulla memoria intercalata.

DR: Impossibile deconfigurare una scheda CPU/memoria che ha la memoria permanente (ID 4210280)

Per deconfigurare e successivamente scollegare una scheda CPU con una scheda di memoria o di sola memoria, è necessario prima deconfigurare la memoria. Tuttavia, una parte di memoria non può essere attualmente riposizionabile. Questa memoria viene considerata permanente.

La memoria permanente su una scheda è contrassegnata "permanent" nella schermata di stato cfgadm:


# cfgadm -s cols=ap_id:type:info
Ap_Id Type Information
ac0:bank0 memory slot3 64Mb base 0x0 permanent
ac0:bank1 memory slot3 empty
ac1:bank0 memory slot5 empty
ac1:bank1 memory slot5 64Mb base 0x40000000

In questo esempio, la scheda in slot3 ha memoria permanente e pertanto non può essere rimossa.

Soluzione: chiudere il sistema prima di intervenire sulla scheda e quindi riavviare.

cfgadm - non è possibile scollegarsi durante l'esecuzione di comandi cfgadm simultanei (ID 4220105)

Se un processo cfgadm è in esecuzione su una scheda, un tentativo di sconnettere simultaneamente una seconda scheda non riesce.

Un'operazione di scollegamento cfgadm non riesce se un altro processo cfgadm è già in esecuzione su una scheda diversa. Il messaggio è:


cfgadm: Hardware specific failure: disconnect failed: nexus
error during detach: indirizzo

Soluzione: eseguire una sola operazione cfgadm alla volta. Se un'operazione cfgadm è in esecuzione su una scheda, attendere che essa termini prima di avviare un'operazione di sconnessione su una seconda scheda.

Impossibile rimuovere e/o distaccare le schede del server Sun Enterprise che ospitano le schede QFE dell'host (ID 4231845)

Su un server configurato come server di boot per client x86 Intel basati su Solaris 2.5.1, sono in esecuzione più lavori rpld, a prescindere dal fatto che tali dispositivi siano in uso o meno. Questi riferimenti attivi impediscono alle operazioni DR di staccare questi dispositivi.

Soluzione: eseguire un'operazione di distacco DR:

  1. Rimuovere o rinominare la directory /rplboot.

  2. Chiudere i servizi NFS con questo comando:


    # sh /etc/init.d/nfs.server stop
    

  3. Eseguire l'operazione di distacco DR.

  4. Riavviare i servizi NFS con questo comando:


    # sh /etc/init.d/nfs.server start