Supplemento alle note sulla versione Solaris 7 8/99 per hardware Sun

Capitolo 5 Problemi irrisolti nei sistemi Sun Enterprise 6x00, 5x00, 4x00 e 3x00

AP su server Sun Enterprise

Questa sezione contiene le note sulla versione per Alternate Pathing (AP) 2.2 su tutti i server Sun Enterprise, tranne il Sun Enterprise(TM) 10000. Per informazioni sul server Sun Enterprise 10000, vedere "AP sul Sun Enterprise 10000".


Nota -

AP 2.2 è la prima versione di AP che supporta Solaris 7 8/99.


AP consente di definire e controllare i percorsi fisici e alternativi sulle periferiche, aggiungendo maggiore disponibilità e un livello di ripristino in seguito ad errori sul server. Se un percorso fisico su un dispositivo diventa non disponibile, è possibile utilizzare un percorso alternativo. Per ulteriori informazioni, vedere Sun Enterprise Server AP User's Guide in Solaris 7 8/99 on Sun Hardware Collection AnswerBook2(TM).


Nota -

Al momento della stampa, AP 2.2 Beta non è compatibile con alcuna versione di Sun Enterprise Volume Manager(TM) (SEVM).


Problemi di installazione

Se si sta effettuando l'aggiornamento da Solaris 2.6 a Solaris 7 8/99 e nel sistema è disponibile AP 2.1 e Solstice(TM) DiskSuite(TM) 4.0 oppure 4.1 (SDS), è necessario eseguire l'aggiornamento ad AP 2.2 e SDS 4.2. Questa sezione contiene una panoramica sull'intera processo, che richiede l'utilizzo di varie sezioni provenienti da diverse pubblicazioni. Prima di iniziare l'aggiornamento, assicurarsi di disporre delle seguenti pubblicazioni:


Avvertenza - Avvertenza -

Per completare l'aggiornamento con successo è necessario seguire la sequenza qui illustrata.


In generale, è necessario eseguire le seguenti operazioni:

In particolare, è necessario effettuare le seguenti operazioni:

  1. Leggere "Esecuzione di un aggiornamento di AP" in Solaris 7 8/99: Guida alle piattaforme hardware Sun.

  2. Registrare tutti gli eventuali medatadispositivi non registrati (vedere il punto 1 in "Per eseguire l'aggiornamento ad AP 2.2" in Solaris 7 8/99: Guida alle piattaforme hardware Sun).

  3. Deconfigurare SDS (vedere i punti da 1 a 8 in "How to Convert to DiskSuite 4.2 on SPARC Systems Running DiskSuite 4.0 or 4.1" in Solstice DiskSuite 4.2 Installation and Product Notes).


    Avvertenza - Avvertenza -

    Non installare Solaris 7 8/99 in questo momento.


  4. Rimuovere la configurazione AP corrente (vedere il punto 3 in "Per eseguire l'aggiornamento ad AP 2.2" in Solaris 7 8/99: Guida alle piattaforme hardware Sun).

  5. Effettuare l'aggiornamento a Solaris 7 8/99 (vedere il punto 4 in "Per eseguire l'aggiornamento ad AP 2.2" in Solaris 7 8/99: Guida alle piattaforme hardware Sun).

  6. Effettuare l'aggiornamento ad AP 2.2 (vedere il punto 5 in "Per eseguire l'aggiornamento ad AP 2.2" in Solaris 7 8/99: Guida alle piattaforme hardware Sun).

  7. Installare SDS 4.2, quindi ripristinarlo (vedere il punto 6 in "Per eseguire l'aggiornamento ad AP 2.2" in Solaris 7 8/99: Guida alle piattaforme hardware Sun e i punti dal 10 al 16 in "How to Convert to DiskSuite 4.2 on SPARC Systems Running DiskSuite 4.0 or 4.1" nel Capitolo 1 della Solstice DiskSuite 4.2 Installation and Product Notes).

Problemi generali

Questa sezione contiene i problemi generali che crea AP sui server Sun Enterprise. Prima di tentare di installare o configurare AP, leggere questa sezione.

Dispositivi supportati

I seguenti dispositivi sono supportati dal software AP sui server Sun Enterprise:

La seguente tabella riporta i dispositivi supportati nelle rispettive versioni:

Tabella 5-1 Dispositivi di rete supportati

 

AP 2.0 

AP 2.1 

AP 2.2 

Solaris 2.5.1 

hme, le, nf, bf, hi, qe, qfe

N/A 

N/A 

Solaris 2.6 (5/98) 

N/A 

ge, hme, le, nf, qe, qfe, vge

N/A 

Solaris 7 5/99 

N/A 

N/A 

ge,hme, le, nf, qe, qfe

Dispositivi SunFDDI e GigabitEthernet

I test di convalida AP 2.2 sono stati eseguiti su SunFDDI (revisione 6.0) e GigabitEthernet (revisione 2.0). Se si installa uno di questi dispositivi, è necessario utilizzare il livello di revisione provato, a meno che non esista un livello di revisione più elevato. Inoltre, è necessario installare tutte le patch disponibili per questi dispositivi. Per ulteriori informazioni sulle patch, vedere http://www.sunsolve.sun.com.

Sun StorEdge A3000

Sun StorEdge A3000 supporta capacità di failover simili a quelle fornite da AP. Per questo motivo, AP non supporta Sun StorEdge A3000. Per ulteriori informazioni sul supporto di failover, vedere la documentazione del prodotto in questione.

Sun StorEdge A5000

AP supporta Sun StorEdge A5000 per questa versione.

Sun StorEdge A7000

AP 2.2 non supporta Sun StorEdge A7000 per questa versione.

Compatibilità software

L' elenco seguente include le possibili combinazioni del software AP e Solaris installabili su un server Sun Enterprise.

Problemi risolti

Questa sezione contiene il riepilogo e l'identificativo Sun dei problemi più importanti che sono stati risolti dopo la versione AP 2.1 (Solaris 2.6 5/98). Questo elenco non comprende tutti i singoli problemi risolti.

4126743 - L'autofailover del disco AP si blocca in presenza di errori su gruppi di percorsi multipli (questo problema è stato riparato da BugID 4136249).

4126897 - Il dominio produce un errore di tipo panic quando non ci sono voci di database e metadispositivi AP in /etc/vfstab.

4136249 - Gli I/O sui volumi SEVM RAID si bloccano dopo un autofailover AP.

4141438 - L'interfaccia mhme si blocca quando la rete viene utilizzata in modo intensivo.

4143514 - FDDI con AP si blocca quanto la rete viene utilizzata in modo intensivo.

4147674 - AP fa sì che ifconfig si blocchi su un mutex.

4153152 - apconfig funziona come un normale utente.

4161396 - AP 2.x richiede la funzionalità di lavorare con GEM.

4163270 - netstat dell'interfaccia di metarete AP non mostra alcun segno.

4166620 - snoop dell'interfaccia di metarete di AP smette di eseguire snoop dopo la commutazione.

4170818 - Se si esegue il comando $<callouts nadb macro o il comando fm2's "callout ts", vengono visualizzate migliaia di timeout di attivazione di code nella tabella callout di timeshare.

4180055 - Accesso a un metadisco di AP con panics alternativo attivo non riuscito.

4180702 - I messaggi provenienti da swap.c non sono tradotti.

4183581 - apboot disco determina un coredump quando disco è identico al disco di boot corrente.

4185154 - AP GigabitEthernet stress test hands.

4188418 - È possibile che un errore del disco rigido non venga rilevato da Veritas [SEVM].

4195441 - AP2.0 ap_daemon non comunica con AP2.2.

4228731 - Le interfacce di rete non esistenti non sono contrassegnate come staccate dopo il riavvio.

Riconfigurazione dinamica dei sistemi Sun Enterprise 6x00, 5x00, 4x00 e 3x00

Queste note contengono le informazioni più recenti sulle funzionalità di riconfigurazione dinamica (DR) per i sistemi Sun EnterpriseTM 6x00, 5x00, 4x00 e 3x00 in cui è in esecuzione la versione dell'aggiornamento 8/99 della linea di prodotti SolarisTM 7 della Sun Microsystems. Per informazioni più complete sulle funzioni di riconfigurazione dinamica per i server Sun Enterprise, vedere il manuale Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems.

L'aggiornamento 8/99 include il supporto per le schede CPU/Memoria sui sistemi Sun Enterprise 6x00, 5x00, 4x00 e 3x00.

Hardware supportato

Prima di procedere, verificare che il sistema sia dotato di funzionalità di riconfigurazione dinamica (DR). Se il messaggio seguente compare sulla console o nei log di sistema, l'hardware in uso non è il più recente e non consente l'utilizzo delle funzioni DR.


Hot Plug not supported in this system 

Le schede di I/O supportate sono elencate nella sezione relativa a "Solaris 7 8/99" nel sito Web

http://sunsolve5.sun.com/sunsolve/Enterprise-dr/

Le schede di I/O tipo 2 (grafica), tipo 3 (PCI) e tipo 5 (grafica e SOC+) non sono correntemente supportate.

Note sul firmware

Array di dischi o unità interne FC-AL

Per gli array di dischi Sun StorEdge A5000 e i dischi interni FC-AL dei sistemi Sun Enterprise 3500, la versione del firmware deve essere ST19171FC 0413 o successiva. Per maggiori informazioni, vedere la sezione relativa a "Solaris 7 8/99" nel sito Web:

http://sunsolve5.sun.com/sunsolve/Enterprise-dr/

Aggiornamenti della PROM per CPU e schede di I/O

Gli utenti del software Solaris 7 8/99 che desiderano utilizzare la riconfigurazione dinamica devono eseguire la PROM di CPU versione 3.2.22 (ID patch firmware 103346-xx) o superiore. Questo firmware è disponibile presso il sito Web. Vedere "Come ottenere il firmware".

Le vecchie versioni della PROM CPU potrebbero visualizzare il seguente messaggio durante il boot:


Firmware does not support Dynamic Reconfiguration


Avvertenza - Avvertenza -

La PROM CPU 3.2.16 e le versioni precedenti non visualizzano questo messaggio, anche se non supportano la riconfigurazione dinamica delle schede CPU/memoria.


  1. Per controllare la revisione della PROM corrente, digitare .version e banner al prompt ok. Verranno visualizzati messaggi simili ai seguenti:

    ok .version
    Slot 0 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31
    Slot 1 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31
    Slot 2 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 3 - I/O Type 4 FCODE 1.8.22 1999/xx/xx 19:27 iPOST 3.4.22 1999/xx/xx 19:31
    Slot 4 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 5 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 6 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 7 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 9 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 11 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 12 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    Slot 14 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31
    ok banner
     16-slot Sun Enterprise E6500
     OpenBoot 3.2.22, 4672 MB memory installed, Serial #xxxxxxxx.
     Ethernet address 8:0:xx:xx:xx:xx, Host ID: xxxxxxxx.

Come ottenere il firmware

Per informazioni su come aggiornare il firmware, vedere la sezione relativa a "Solaris 7 8/99" nel sito Web.

http://sunsolve5.sun.com/sunsolve/Enterprise-dr/

In questo sito, si troveranno le informazioni su come:

Se non si riesce a utilizzare il sito Web, chiedere aiuto al fornitore di servizi di supporto.

Note sul software

Attivazione della riconfigurazione dinamica

Nel file /etc/system, devono essere impostate due variabili per attivare la riconfigurazione dinamica e deve essere impostata un'ulteriore variabile per attivare la rimozione delle schede CPU/memoria.

  1. Collegarsi come root.

  2. Per attivare la riconfigurazione dinamica, modificare il file /etc/system e aggiungere le righe seguenti al file /etc/system:


    set pln:pln_enable_detach_suspend=1
    set soc:soc_enable_detach_suspend=1
    

  3. Per attivare la rimozione di una scheda CPU/memoria, aggiungere questa riga al file /etc/system:


    set kernel_cage_enable=1
    

    L'impostazione di questa variabile consente l'operazione di deconfigurazione della memoria.

  4. Riavviare il sistema per rendere attive le modifiche.

Test Quiesce

Su sistemi di grandi dimensioni, il comando quiesce-test (cfgadm -x quiesce-test sysctrl0:slotnumero) può rimanere in esecuzione per un minuto circa. Per tutto questo periodo, qualora cfgadm non riesca ad individuare driver incompatibili, non viene visualizzato nessun messaggio. Si tratta del normale comportamento del comando.

Elenco delle schede disabilitate

Se una scheda si trova nell'elenco delle schede disabilitate, un tentativo di collegamento alla scheda può generare un messaggio di errore:


# cfgadm -c connect sysctrl0:slotnumero
cfgadm: Hardware specific failure: connect failed: board is
disabled: must override with [-f][-o enable-at-boot]

  1. Per escludere la condizione disabilitata, utilizzare l'indicatore di force (-f) oppure l'opzione enable (-o enable-at-boot) con il comando cfgadm:


    # cfgadm -f -c connect sysctrl0:slotnumero
    


    # cfgadm -o enable-at-boot -c connect sysctrl0:slotnumero
    

  1. Per rimuovere tutte le schede dall'elenco delle schede disabilitate, impostare la variabile disabled-board-list su un set null con il comando system:


    # eeprom disabled-board-list=
    

  1. Se ci si trova nel prompt OpenBootTM, utilizzare questo comando OBP invece di rimuovere tutte le schede dall'elenco delle schede disattivate:


    OK set-default disabled-board-list 
    

    Per ulteriori informazioni sull'impostazione disabled-board-list, consultare la sezione "Variabili NVRAM specifiche" nelle Note sulle piattaforme: Sistemi Sun Enterprise 3x00, 4x00, 5x00 e 6x00, numero di parte 805-4454.

Elenco delle memorie disattivate

Per informazioni sull'impostazione OBP disabled-memory-list, consultare la sezione "Variabili NVRAM specifiche" nelle Note sulle piattaforme: Sistemi Sun Enterprise 3x00, 4x00, 5x00 e 6x00, numero di parte 805-4454.

Scaricamento dei driver Detach-Unsafe

Qualora sia necessario scaricare driver detach-unsafe, usare il comando modinfo(1M) per individuare gli ID di modulo dei driver. A questo punto è possibile utilizzare tali ID nel comando modunload(1M) per scaricare i driver detach-unsafe.

Memoria intercalata

Una scheda di memoria oppure una scheda CPU/memoria contenente memoria intercalata non può essere deconfigurata automaticamente.

Per determinare la memoria è intercalata, utilizzare il comando prtdiag o il comando cfgadm.

Per consentire le operazioni DR sulle schede CPU/memoria, impostare la proprietà NVRAM memory-interleave su min.

Per informazioni correlate sulla memoria intercalata, vedere "Intercalamento della memoria impostato non correttamente dopo un ripristino fatale, ID 4156075 " e "DR: Impossibile deconfigurare una scheda CPU/memoria che abbia memoria intercalata, ID 4210234".

Errore dell'auto-test durante una sequenza di collegamento

Se l'errore "cfgadm: Hardware specific failure: connect failed: firmware operation error" viene visualizzato durante una sequenza di collegamento DR, rimuovere la scheda dal sistema non appena possibile. La scheda non ha superato l'auto-test e la rimozione della scheda evita i possibili errori di riconfigurazione che possono verificarsi nel corso del riavvio successivo.

Se si desidera riprovare immediatamente l'operazione non riuscita, è necessario prima rimuovere e reinserire la scheda, in quanto lo stato della scheda non consente ulteriori operazioni.

Caratteristica di riconfigurazione dinamica nel software Sun Enterprise SyMON

Come spiegato in Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems, il software di controllo e gestione del sistema Sun Enterprise SyMONTM supporta la riconfigurazione dinamica. Tuttavia, il manuale dell'utente riportava il riferimento sbagliato. Il riferimento corretto è Sun Enterprise SyMON 2.0.1(TM): Supplemento per Server midrange Sun Enterprise(TM), numero di parte 806-1158.

Problemi noti

Per informazioni sempre aggiornate sugli ultimi problemi rilevati e le patch disponibili, accedere al sito: http://sunsolve5.sun.com/sunsolve/Enterprise-dr.

cfgadm -v Non funziona correttamente, ID 4149371

Categoria: RFE

Il test della memoria dovrebbe fornire indicazioni occasionali fino a quando è ancora in esecuzione. Durante un test lungo, l'utente non può determinare facilmente che il sistema non si sta bloccando.

Soluzione: controllare l'andamento del sistema in un'altra shell o finestra, utilizzando vmstat(1M), ps(1), o altri comandi shell simili.

Intercalamento della memoria impostato non correttamente dopo un ripristino fatale, ID 4156075

Categoria: errore

L'intercalamento della memoria viene lasciato in uno stato non corretto dopo che un server Sun Enterprise X500 incontra un Fatal Reset. Le successive operazioni DR non riusciranno. Il problema si verifica sui sistemi con l'intercalamento della memoria impostato su min.

Soluzioni: ci sono due possibilità.

L'output vmstat è errato dopo aver configurato i processori, ID 4159024

Categoria: errore

vmstat mostra un numero insolitamente alto di interrupt dopo aver configurato le CPU. Con vmstat sullo sfondo, il campo di interrupt assume una grandezza anormale (ma questo non è indice di un problema). Nell'ultima riga dell'esempio seguente, la colonna degli interrupt (in) ha un valore pari a 4294967216:

# procs memory page disk faults cpu
r b w swap free re mf pi po fr de sr s6 s9 s1 -- in sy cs us sy id
0 0 0 437208 146424 0 1 4 0 0 0 0 0 1 0 0 50 65 79 0 1 99
0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 198 137 214 0 3 97
0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 286 101 200 0 3 97
0 0 0 413864 111072 0 11 0 0 0 0 0 0 1 0 0 4294967216 43 68 0 0 100

Soluzione: riavviare vmstat.

Lo stato della scheda di sistema POST visualizza solo 1 delle 2 CPU con errori, ID 4200513

Categoria: errore

Se su due CPU su un'unica scheda si verifica un errore prima che esso venga riferito alla CPU principale, il display dello stato del sistema POST riporta una delle CPU come se si fosse verificato un errore, ma la seconda CPU potrebbe non venire elencata affatto.

Soluzione: nessuna.

DR: Impossibile deconfigurare una scheda CPU/memoria che abbia memoria intercalata, ID 4210234

Categoria: RFE

Impossibile deconfigurare una scheda CPU/memoria che abbia memoria intercalata.

Per deconfigurare e successivamente scollegare una scheda CPU con una scheda di memoria oppure una scheda di sola memoria, è necessario deconfigurare prima la memoria. Tuttavia, se la memoria della scheda è intercalata con la memoria sulle altre schede, correntemente la memoria non può venire deconfigurata dinamicamente.

L'intercalamento della memoria può essere visualizzato utilizzando i comandi prtdiag o cfgadm.

Soluzione: chiudere il sistema prima di riparare la scheda, quindi riavviare. Per consentire le future operazioni DR sulla scheda CPU/memoria, impostare la proprietà NVRAM memory-interleave su min. Vedere anche "Intercalamento della memoria impostato non correttamente dopo un ripristino fatale, ID 4156075 " per spiegazioni dettagliate sulla memoria intercalata.

DR: Impossibile deconfigurare una scheda CPU/memoria che ha la memoria permanente, ID 4210280

Categoria: RFE

Per deconfigurare e successivamente scollegare una scheda CPU con una scheda di memoria o di sola memoria, è necessario prima deconfigurare la memoria. Tuttavia, una parte di memoria non può essere attualmente riposizionabile. Questa memoria viene considerata permanente.

La memoria permanente su una scheda è contrassegnata "permanent" nella schermata di stato cfgadm:


# cfgadm -s cols=ap_id:type:info
Ap_Id Type Information
ac0:bank0 memory slot3 64Mb base 0x0 permanent
ac0:bank1 memory slot3 empty
ac1:bank0 memory slot5 empty
ac1:bank1 memory slot5 64Mb base 0x40000000

In questo esempio, la scheda in slot3 ha memoria permanente e pertanto non può essere rimossa.

Soluzione: chiudere il sistema prima di intervenire sulla scheda e quindi riavviare.

cfgadm Lo scollegamento non riesce durante l'esecuzione di comandi cfgadm simultanei, ID 4220105

Categoria: errore

Se un processo cfgadm è in esecuzione su una scheda, un tentativo di sconnettere simultaneamente una seconda scheda non riesce.

Un'operazione di scollegamento cfgadm non riesce se un altro processo cfgadm è già in esecuzione su una scheda diversa. Il messaggio è:


cfgadm: Hardware specific failure: disconnect failed: nexus
error during detach: indirizzo

Soluzione: eseguire una sola operazione cfgadm alla volta. Se un'operazione cfgadm è in esecuzione su una scheda, attendere che essa termini prima di avviare un'operazione di sconnessione su una seconda scheda.

Ripristino fatale su init 5 dopo operazioni DR, ID 4220852

Categoria: errore

Dopo che sono state eseguite operazioni DR, il tentativo di chiusura del sistema con il comando init 5 potrebbe causare un errore fatale.

Soluzione: ripristinare il sistema, quindi disattivarlo specificando il comando power-off al prompt ok.

Impossibile rimuovere e/o staccare le schede del server Sun Enterprise che ospitano le schede QFE dell'host, ID 4231845

Quando un server viene configurato come server di boot per client x86 basati su Solaris 2.5.1, in esso sono in esecuzione più lavori rpld, a prescindere dal fatto che tali dispositivi siano in uso o meno. Questi riferimenti attivi impediscono alle operazioni DR di staccare questi dispositivi.

Soluzione: per eseguire un'operazione di distacco DR:

  1. Rimuovere o rinominare la directory /rplboot.

  2. Chiudere i servizi NFS con questo comando:


    # sh /etc/init.d/nfs.server stop
    

  3. Eseguire l'operazione di distacco DR.

  4. Riavviare i servizi NFS con questo comando:


    # sh /etc/init.d/nfs.server start