Questa sezione contiene le note sulla versione per Alternate Pathing (AP) 2.2 su tutti i server Sun Enterprise, tranne il Sun Enterprise(TM) 10000. Per informazioni sul server Sun Enterprise 10000, vedere "AP sul Sun Enterprise 10000".
AP 2.2 è la prima versione di AP che supporta Solaris 7 8/99.
AP consente di definire e controllare i percorsi fisici e alternativi sulle periferiche, aggiungendo maggiore disponibilità e un livello di ripristino in seguito ad errori sul server. Se un percorso fisico su un dispositivo diventa non disponibile, è possibile utilizzare un percorso alternativo. Per ulteriori informazioni, vedere Sun Enterprise Server AP User's Guide in Solaris 7 8/99 on Sun Hardware Collection AnswerBook2(TM).
Al momento della stampa, AP 2.2 Beta non è compatibile con alcuna versione di Sun Enterprise Volume Manager(TM) (SEVM).
Se si sta effettuando l'aggiornamento da Solaris 2.6 a Solaris 7 8/99 e nel sistema è disponibile AP 2.1 e Solstice(TM) DiskSuite(TM) 4.0 oppure 4.1 (SDS), è necessario eseguire l'aggiornamento ad AP 2.2 e SDS 4.2. Questa sezione contiene una panoramica sull'intera processo, che richiede l'utilizzo di varie sezioni provenienti da diverse pubblicazioni. Prima di iniziare l'aggiornamento, assicurarsi di disporre delle seguenti pubblicazioni:
Solaris 7 8/99: Supplemento alle note sulla versione per hardware Sun (disponibile in forma cartacea sul Solaris 7 8/99 Media Kit)
Solaris 7 8/99: Guida alle piattaforme hardware Sun, (disponibile in forma cartacea sul Solaris 7 8/99 Media Kit o nel formato AnswerBook2 sul CD Sun Hardware Supplements)
Sun Enterprise Server Alternate Pathing User's Guide (disponibile nel formato AnswerBook2 sul CD Sun Hardware Supplements nel Solaris 7 8/99 Media Kit)
Solstice DiskSuite 4.2 User's Guide (disponibile nel formato AnswerBook2 nel sito http://docs.sun.com o nell'SDS Media Kit)
Solstice DiskSuite 4.2 Installation and Product Notes (disponibile nel formato AnswerBook2 nel sito http://docs.sun.com o sull'SDS Media Kit)
Per completare l'aggiornamento con successo è necessario seguire la sequenza qui illustrata.
In generale, è necessario eseguire le seguenti operazioni:
Deconfigurare SDS 4.0 o 4.1.
Rimuovere AP 2.1.
Effettuare l'aggiornamento a Solaris 7 8/99.
Installare AP 2.2.
Installare e riconfigurare SDS 4.2.
In particolare, è necessario effettuare le seguenti operazioni:
Leggere "Esecuzione di un aggiornamento di AP" in Solaris 7 8/99: Guida alle piattaforme hardware Sun.
Registrare tutti gli eventuali medatadispositivi non registrati (vedere il punto 1 in "Per eseguire l'aggiornamento ad AP 2.2" in Solaris 7 8/99: Guida alle piattaforme hardware Sun).
Deconfigurare SDS (vedere i punti da 1 a 8 in "How to Convert to DiskSuite 4.2 on SPARC Systems Running DiskSuite 4.0 or 4.1" in Solstice DiskSuite 4.2 Installation and Product Notes).
Non installare Solaris 7 8/99 in questo momento.
Rimuovere la configurazione AP corrente (vedere il punto 3 in "Per eseguire l'aggiornamento ad AP 2.2" in Solaris 7 8/99: Guida alle piattaforme hardware Sun).
Effettuare l'aggiornamento a Solaris 7 8/99 (vedere il punto 4 in "Per eseguire l'aggiornamento ad AP 2.2" in Solaris 7 8/99: Guida alle piattaforme hardware Sun).
Effettuare l'aggiornamento ad AP 2.2 (vedere il punto 5 in "Per eseguire l'aggiornamento ad AP 2.2" in Solaris 7 8/99: Guida alle piattaforme hardware Sun).
Installare SDS 4.2, quindi ripristinarlo (vedere il punto 6 in "Per eseguire l'aggiornamento ad AP 2.2" in Solaris 7 8/99: Guida alle piattaforme hardware Sun e i punti dal 10 al 16 in "How to Convert to DiskSuite 4.2 on SPARC Systems Running DiskSuite 4.0 or 4.1" nel Capitolo 1 della Solstice DiskSuite 4.2 Installation and Product Notes).
Questa sezione contiene i problemi generali che crea AP sui server Sun Enterprise. Prima di tentare di installare o configurare AP, leggere questa sezione.
I seguenti dispositivi sono supportati dal software AP sui server Sun Enterprise:
SPARCstorage(TM) Arrays riconosciuto da AP utilizzando le porte pln,soc e ssd
Sun(TM) StorEdge(TM) A5000 riconosciuto da AP utilizzando le porte sf, socal e ssd
SunFastEthernet(TM) 2.0 (hme)
SunFDDI(TM) 5.0 (nf) SAS (Single-Attach Station) e DAS (Dual-Attach Station)
SCSI-2/Buffered Ethernet FSBE/S e DSBE/S (le)
Quad Ethernet (qe)
Sun(TM) Quad FastEthernet(TM) (qfe)
Sun GigabitEthernet 2.0 (ge)
La seguente tabella riporta i dispositivi supportati nelle rispettive versioni:
Tabella 5-1 Dispositivi di rete supportati
|
AP 2.0 |
AP 2.1 |
AP 2.2 |
---|---|---|---|
Solaris 2.5.1 |
hme, le, nf, bf, hi, qe, qfe |
N/A |
N/A |
Solaris 2.6 (5/98) |
N/A |
ge, hme, le, nf, qe, qfe, vge |
N/A |
Solaris 7 5/99 |
N/A |
N/A |
ge,hme, le, nf, qe, qfe |
I test di convalida AP 2.2 sono stati eseguiti su SunFDDI (revisione 6.0) e GigabitEthernet (revisione 2.0). Se si installa uno di questi dispositivi, è necessario utilizzare il livello di revisione provato, a meno che non esista un livello di revisione più elevato. Inoltre, è necessario installare tutte le patch disponibili per questi dispositivi. Per ulteriori informazioni sulle patch, vedere http://www.sunsolve.sun.com.
Sun StorEdge A3000 supporta capacità di failover simili a quelle fornite da AP. Per questo motivo, AP non supporta Sun StorEdge A3000. Per ulteriori informazioni sul supporto di failover, vedere la documentazione del prodotto in questione.
AP supporta Sun StorEdge A5000 per questa versione.
AP 2.2 non supporta Sun StorEdge A7000 per questa versione.
L' elenco seguente include le possibili combinazioni del software AP e Solaris installabili su un server Sun Enterprise.
Solaris 2.6 5/98 con AP 2.1 e DR
Solaris 7 con AP 2.2 e DR
Solaris 7 5/99 con AP 2.2 e DR
Questa sezione contiene il riepilogo e l'identificativo Sun dei problemi più importanti che sono stati risolti dopo la versione AP 2.1 (Solaris 2.6 5/98). Questo elenco non comprende tutti i singoli problemi risolti.
4126743 - L'autofailover del disco AP si blocca in presenza di errori su gruppi di percorsi multipli (questo problema è stato riparato da BugID 4136249).
4126897 - Il dominio produce un errore di tipo panic quando non ci sono voci di database e metadispositivi AP in /etc/vfstab.
4136249 - Gli I/O sui volumi SEVM RAID si bloccano dopo un autofailover AP.
4141438 - L'interfaccia mhme si blocca quando la rete viene utilizzata in modo intensivo.
4143514 - FDDI con AP si blocca quanto la rete viene utilizzata in modo intensivo.
4147674 - AP fa sì che ifconfig si blocchi su un mutex.
4153152 - apconfig funziona come un normale utente.
4161396 - AP 2.x richiede la funzionalità di lavorare con GEM.
4163270 - netstat dell'interfaccia di metarete AP non mostra alcun segno.
4166620 - snoop dell'interfaccia di metarete di AP smette di eseguire snoop dopo la commutazione.
4170818 - Se si esegue il comando $<callouts nadb macro o il comando fm2's "callout ts", vengono visualizzate migliaia di timeout di attivazione di code nella tabella callout di timeshare.
4180055 - Accesso a un metadisco di AP con panics alternativo attivo non riuscito.
4180702 - I messaggi provenienti da swap.c non sono tradotti.
4183581 - apboot disco determina un coredump quando disco è identico al disco di boot corrente.
4185154 - AP GigabitEthernet stress test hands.
4188418 - È possibile che un errore del disco rigido non venga rilevato da Veritas [SEVM].
4195441 - AP2.0 ap_daemon non comunica con AP2.2.
4228731 - Le interfacce di rete non esistenti non sono contrassegnate come staccate dopo il riavvio.
Queste note contengono le informazioni più recenti sulle funzionalità di riconfigurazione dinamica (DR) per i sistemi Sun EnterpriseTM 6x00, 5x00, 4x00 e 3x00 in cui è in esecuzione la versione dell'aggiornamento 8/99 della linea di prodotti SolarisTM 7 della Sun Microsystems. Per informazioni più complete sulle funzioni di riconfigurazione dinamica per i server Sun Enterprise, vedere il manuale Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems.
L'aggiornamento 8/99 include il supporto per le schede CPU/Memoria sui sistemi Sun Enterprise 6x00, 5x00, 4x00 e 3x00.
Prima di procedere, verificare che il sistema sia dotato di funzionalità di riconfigurazione dinamica (DR). Se il messaggio seguente compare sulla console o nei log di sistema, l'hardware in uso non è il più recente e non consente l'utilizzo delle funzioni DR.
Hot Plug not supported in this system
Le schede di I/O supportate sono elencate nella sezione relativa a "Solaris 7 8/99" nel sito Web
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
Le schede di I/O tipo 2 (grafica), tipo 3 (PCI) e tipo 5 (grafica e SOC+) non sono correntemente supportate.
Per gli array di dischi Sun StorEdge A5000 e i dischi interni FC-AL dei sistemi Sun Enterprise 3500, la versione del firmware deve essere ST19171FC 0413 o successiva. Per maggiori informazioni, vedere la sezione relativa a "Solaris 7 8/99" nel sito Web:
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
Gli utenti del software Solaris 7 8/99 che desiderano utilizzare la riconfigurazione dinamica devono eseguire la PROM di CPU versione 3.2.22 (ID patch firmware 103346-xx) o superiore. Questo firmware è disponibile presso il sito Web. Vedere "Come ottenere il firmware".
Le vecchie versioni della PROM CPU potrebbero visualizzare il seguente messaggio durante il boot:
Firmware does not support Dynamic Reconfiguration
La PROM CPU 3.2.16 e le versioni precedenti non visualizzano questo messaggio, anche se non supportano la riconfigurazione dinamica delle schede CPU/memoria.
Per controllare la revisione della PROM corrente, digitare .version e banner al prompt ok. Verranno visualizzati messaggi simili ai seguenti:
ok .version |
Slot 0 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 1 - I/O Type 1 FCODE 1.8.22 1999/xx/xx 19:26 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 2 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 3 - I/O Type 4 FCODE 1.8.22 1999/xx/xx 19:27 iPOST 3.4.22 1999/xx/xx 19:31 |
Slot 4 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 5 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 6 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 7 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 9 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 11 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 12 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
Slot 14 - CPU/Memory OBP 3.2.22 1999/xx/xx 19:27 POST 3.9.22 1999/xx/xx 19:31 |
ok banner |
16-slot Sun Enterprise E6500 |
OpenBoot 3.2.22, 4672 MB memory installed, Serial #xxxxxxxx. |
Ethernet address 8:0:xx:xx:xx:xx, Host ID: xxxxxxxx. |
Per informazioni su come aggiornare il firmware, vedere la sezione relativa a "Solaris 7 8/99" nel sito Web.
http://sunsolve5.sun.com/sunsolve/Enterprise-dr/
In questo sito, si troveranno le informazioni su come:
Scaricare il firmware della PROM dotata di funzionalità di DR
Aggiornare la PROM
Se non si riesce a utilizzare il sito Web, chiedere aiuto al fornitore di servizi di supporto.
Nel file /etc/system, devono essere impostate due variabili per attivare la riconfigurazione dinamica e deve essere impostata un'ulteriore variabile per attivare la rimozione delle schede CPU/memoria.
Collegarsi come root.
Per attivare la riconfigurazione dinamica, modificare il file /etc/system e aggiungere le righe seguenti al file /etc/system:
set pln:pln_enable_detach_suspend=1 set soc:soc_enable_detach_suspend=1
Per attivare la rimozione di una scheda CPU/memoria, aggiungere questa riga al file /etc/system:
set kernel_cage_enable=1
L'impostazione di questa variabile consente l'operazione di deconfigurazione della memoria.
Riavviare il sistema per rendere attive le modifiche.
Su sistemi di grandi dimensioni, il comando quiesce-test (cfgadm -x quiesce-test sysctrl0:slotnumero) può rimanere in esecuzione per un minuto circa. Per tutto questo periodo, qualora cfgadm non riesca ad individuare driver incompatibili, non viene visualizzato nessun messaggio. Si tratta del normale comportamento del comando.
Se una scheda si trova nell'elenco delle schede disabilitate, un tentativo di collegamento alla scheda può generare un messaggio di errore:
# cfgadm -c connect sysctrl0:slotnumero cfgadm: Hardware specific failure: connect failed: board is disabled: must override with [-f][-o enable-at-boot]
Per escludere la condizione disabilitata, utilizzare l'indicatore di force (-f) oppure l'opzione enable (-o enable-at-boot) con il comando cfgadm:
# cfgadm -f -c connect sysctrl0:slotnumero
# cfgadm -o enable-at-boot -c connect sysctrl0:slotnumero
Per rimuovere tutte le schede dall'elenco delle schede disabilitate, impostare la variabile disabled-board-list su un set null con il comando system:
# eeprom disabled-board-list=
Se ci si trova nel prompt OpenBootTM, utilizzare questo comando OBP invece di rimuovere tutte le schede dall'elenco delle schede disattivate:
OK set-default disabled-board-list
Per ulteriori informazioni sull'impostazione disabled-board-list, consultare la sezione "Variabili NVRAM specifiche" nelle Note sulle piattaforme: Sistemi Sun Enterprise 3x00, 4x00, 5x00 e 6x00, numero di parte 805-4454.
Per informazioni sull'impostazione OBP disabled-memory-list, consultare la sezione "Variabili NVRAM specifiche" nelle Note sulle piattaforme: Sistemi Sun Enterprise 3x00, 4x00, 5x00 e 6x00, numero di parte 805-4454.
Qualora sia necessario scaricare driver detach-unsafe, usare il comando modinfo(1M) per individuare gli ID di modulo dei driver. A questo punto è possibile utilizzare tali ID nel comando modunload(1M) per scaricare i driver detach-unsafe.
Una scheda di memoria oppure una scheda CPU/memoria contenente memoria intercalata non può essere deconfigurata automaticamente.
Per determinare la memoria è intercalata, utilizzare il comando prtdiag o il comando cfgadm.
Per consentire le operazioni DR sulle schede CPU/memoria, impostare la proprietà NVRAM memory-interleave su min.
Per informazioni correlate sulla memoria intercalata, vedere "Intercalamento della memoria impostato non correttamente dopo un ripristino fatale, ID 4156075 " e "DR: Impossibile deconfigurare una scheda CPU/memoria che abbia memoria intercalata, ID 4210234".
Se l'errore "cfgadm: Hardware specific failure: connect failed: firmware operation error" viene visualizzato durante una sequenza di collegamento DR, rimuovere la scheda dal sistema non appena possibile. La scheda non ha superato l'auto-test e la rimozione della scheda evita i possibili errori di riconfigurazione che possono verificarsi nel corso del riavvio successivo.
Se si desidera riprovare immediatamente l'operazione non riuscita, è necessario prima rimuovere e reinserire la scheda, in quanto lo stato della scheda non consente ulteriori operazioni.
Come spiegato in Dynamic Reconfiguration User's Guide for Sun Enterprise 3x00/4x00/5x00/6x00 Systems, il software di controllo e gestione del sistema Sun Enterprise SyMONTM supporta la riconfigurazione dinamica. Tuttavia, il manuale dell'utente riportava il riferimento sbagliato. Il riferimento corretto è Sun Enterprise SyMON 2.0.1(TM): Supplemento per Server midrange Sun Enterprise(TM), numero di parte 806-1158.
Per informazioni sempre aggiornate sugli ultimi problemi rilevati e le patch disponibili, accedere al sito: http://sunsolve5.sun.com/sunsolve/Enterprise-dr.
Categoria: RFE
Il test della memoria dovrebbe fornire indicazioni occasionali fino a quando è ancora in esecuzione. Durante un test lungo, l'utente non può determinare facilmente che il sistema non si sta bloccando.
Soluzione: controllare l'andamento del sistema in un'altra shell o finestra, utilizzando vmstat(1M), ps(1), o altri comandi shell simili.
Categoria: errore
L'intercalamento della memoria viene lasciato in uno stato non corretto dopo che un server Sun Enterprise X500 incontra un Fatal Reset. Le successive operazioni DR non riusciranno. Il problema si verifica sui sistemi con l'intercalamento della memoria impostato su min.
Soluzioni: ci sono due possibilità.
Per risolvere il problema dopo che si è verificato, reimpostare manualmente il sistema nel prompt OK.
Per evitare il problema prima che si verifichi, impostare la proprietà NVRAM memory-interleave su max. Questo fa sì che la memoria venga intercalata ogni volta che il sistema viene avviato. Tuttavia, questa opzione potrebbe essere inaccettabile, in quanto la scheda di memoria contenente memoria intercalata non può essere deconfigurata manualmente. Vedere "DR: Impossibile deconfigurare una scheda CPU/memoria che abbia memoria intercalata, ID 4210234".
Categoria: errore
vmstat mostra un numero insolitamente alto di interrupt dopo aver configurato le CPU. Con vmstat sullo sfondo, il campo di interrupt assume una grandezza anormale (ma questo non è indice di un problema). Nell'ultima riga dell'esempio seguente, la colonna degli interrupt (in) ha un valore pari a 4294967216:
# procs memory page disk faults cpu |
r b w swap free re mf pi po fr de sr s6 s9 s1 -- in sy cs us sy id |
0 0 0 437208 146424 0 1 4 0 0 0 0 0 1 0 0 50 65 79 0 1 99 |
0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 198 137 214 0 3 97 |
0 0 0 413864 111056 0 0 0 0 0 0 0 0 0 0 0 286 101 200 0 3 97 |
0 0 0 413864 111072 0 11 0 0 0 0 0 0 1 0 0 4294967216 43 68 0 0 100 |
Soluzione: riavviare vmstat.
Categoria: errore
Se su due CPU su un'unica scheda si verifica un errore prima che esso venga riferito alla CPU principale, il display dello stato del sistema POST riporta una delle CPU come se si fosse verificato un errore, ma la seconda CPU potrebbe non venire elencata affatto.
Soluzione: nessuna.
Categoria: RFE
Impossibile deconfigurare una scheda CPU/memoria che abbia memoria intercalata.
Per deconfigurare e successivamente scollegare una scheda CPU con una scheda di memoria oppure una scheda di sola memoria, è necessario deconfigurare prima la memoria. Tuttavia, se la memoria della scheda è intercalata con la memoria sulle altre schede, correntemente la memoria non può venire deconfigurata dinamicamente.
L'intercalamento della memoria può essere visualizzato utilizzando i comandi prtdiag o cfgadm.
Soluzione: chiudere il sistema prima di riparare la scheda, quindi riavviare. Per consentire le future operazioni DR sulla scheda CPU/memoria, impostare la proprietà NVRAM memory-interleave su min. Vedere anche "Intercalamento della memoria impostato non correttamente dopo un ripristino fatale, ID 4156075 " per spiegazioni dettagliate sulla memoria intercalata.
Categoria: RFE
Per deconfigurare e successivamente scollegare una scheda CPU con una scheda di memoria o di sola memoria, è necessario prima deconfigurare la memoria. Tuttavia, una parte di memoria non può essere attualmente riposizionabile. Questa memoria viene considerata permanente.
La memoria permanente su una scheda è contrassegnata "permanent" nella schermata di stato cfgadm:
# cfgadm -s cols=ap_id:type:info Ap_Id Type Information ac0:bank0 memory slot3 64Mb base 0x0 permanent ac0:bank1 memory slot3 empty ac1:bank0 memory slot5 empty ac1:bank1 memory slot5 64Mb base 0x40000000
In questo esempio, la scheda in slot3 ha memoria permanente e pertanto non può essere rimossa.
Soluzione: chiudere il sistema prima di intervenire sulla scheda e quindi riavviare.
Categoria: errore
Se un processo cfgadm è in esecuzione su una scheda, un tentativo di sconnettere simultaneamente una seconda scheda non riesce.
Un'operazione di scollegamento cfgadm non riesce se un altro processo cfgadm è già in esecuzione su una scheda diversa. Il messaggio è:
cfgadm: Hardware specific failure: disconnect failed: nexus error during detach: indirizzo
Soluzione: eseguire una sola operazione cfgadm alla volta. Se un'operazione cfgadm è in esecuzione su una scheda, attendere che essa termini prima di avviare un'operazione di sconnessione su una seconda scheda.
Categoria: errore
Dopo che sono state eseguite operazioni DR, il tentativo di chiusura del sistema con il comando init 5 potrebbe causare un errore fatale.
Soluzione: ripristinare il sistema, quindi disattivarlo specificando il comando power-off al prompt ok.
Quando un server viene configurato come server di boot per client x86 basati su Solaris 2.5.1, in esso sono in esecuzione più lavori rpld, a prescindere dal fatto che tali dispositivi siano in uso o meno. Questi riferimenti attivi impediscono alle operazioni DR di staccare questi dispositivi.
Soluzione: per eseguire un'operazione di distacco DR: