In Solaris 10 sono presenti i seguenti problemi e bug legati all'hardware.
In alcuni sistemi x86 non viene eseguita l'attivazione della quarta interfaccia 5709 con un 1 GB di RAM. Potrebbe verificarsi un errore panic oppure viene visualizzato un messaggio di errore simile al seguente:
ifconfig: plumb: bnx<X>: Invalid argument |
Questo problema interessa i server Dell PowerEdge R610 e R710.
Soluzione. Procedere come segue:
Utilizzare più di un 1 GB di RAM.
Creare un hostname.bnxX per ogni interfaccia.
Riavviare il sistema.
Scaricare e installare la versione più recente del driver BNX 4.6.2.
Modificare il file bnx.conf per utilizzare l'impostazione predefinita per tx_descriptor_count.
L'aggiornamento del firmware ConnectX alla versione 2.6.000 o superiore in un sistema in esecuzione potrebbe causare problemi in alcune piattaforme HCA e x64. Questo problema interessa solo HCA non native Mellanox. Le piattaforme HCA PCIe, EM, NEM e SPARC di Sun non sono interessate dal problema.
L'avvio del sistema potrebbe non riuscire o il sistema potrebbe bloccarsi durante l'avvio. I numeri di istanza ibd (IPoverIB) possono cambiare e impedire l'avvio del sistema e l'attivazione dei dispositivi ibd.
Soluzione 1. Prima di riavviare il sistema dopo l'aggiornamento del firmware tramite cxflash, rimuovere le istanze ibd<x> dal file /etc/path_to_inst e dalla directory /dev. Procedere come segue:
Eseguire il login come root. I dati della struttura di dispositivi potrebbero avere l'aspetto seguente:
# ls -R /devices | grep 15b3 /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0 /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0/ibport@1,ffff,ipib /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0/ibport@1,ffff,ipib:ibd0 /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0/ibport@2,ffff,ipib /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0/ibport@2,ffff,ipib:ibd1 /devices/pci@0,0/pci10de,5d@e/pci15b3,634a@0:devctl |
Le specifiche del dispositivo variano a seconda della scheda Mellanox non nativa installata.
Modificare il file path_to_inst. Procedere come segue:
Eseguire una copia di backup del file path_to_inst esistente.
# cp /etc/path_to_inst /etc/path_to_inst.backup |
Aprire il file path_to_inst:
# vi /etc/path_to_inst |
Cercare righe contenenti ibd e hermon, quindi eliminarle.
Salvare le modifiche e chiudere il file.
Rimuovere le voci nella directory /dev:
rm /dev/ibd?* |
Riavviare il sistema. Il sistema si avvia normalmente e la struttura di dispositivi corrispondente ha un aspetto analogo al seguente:
# ls -R /devices | grep 15b3 /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0 /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0/ibport@1,ffff,ipib /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0/ibport@1,ffff,ipib:ibd0 /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0/ibport@2,ffff,ipib /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0/ibport@2,ffff,ipib:ibd1 /devices/pci@0,0/pci10de,5d@e/pci15b3,5@0:devctl |
Soluzione 2. Se si riavvia il sistema prima di aggiornare il file path_to_inst e la directory /dev, il sistema può bloccarsi. In tali casi, procedere come segue:
Spegnere il sistema e rimuovere l'HCA dal bus.
Riavviare il sistema senza HCA installato.
Quando il sistema è nuovamente in esecuzione, seguire i passaggi dal 2 al 3 elencati nella soluzione 1.
Spegnere il sistema.
Reinstallare HCA. Riavviare il sistema.
Se il sistema si riavvia, ma le interfacce ibd non vengono attivate automaticamente, i file /etc/hostname.ib<?> potrebbero non essere appropriati per la configurazione di dispositivo corrente. Rinominare manualmente i file per riflettere la configurazione corretta.
Alcuni sistemi IBM si bloccano o generano un errore panic dopo l'installazione. Viene visualizzato il seguente messaggio di errore panic:
Unrecoverable Machine-Check Exception |
Soluzione 1. Aggiungere la seguente riga al file /etc/system dopo l'installazione per evitare il blocco del sistema:
set pcie:pcie_aer_ce_mask=0x11C1 |
Soluzione 2. Se si verifica un errore panic durante l'installazione o durante l'avvio dopo l'installazione, utilizzare questa soluzione. Avviare il sistema, con l'opzione -kd e impostarlo nel debugger kmdb:
::bp pcie`pcie_initchild :c pcie_aer_ce_mask/W 11C1 :d all :c |
Quando il sistema è in esecuzione, aggiungere la seguente riga al file /etc/system per applicare le modifiche in modo permanente:
set pcie:pcie_aer_ce_mask=0x11C1 |
Nei sistemi con processore Intel Xeon della serie MP 7400 e sistema operativo Solaris 10 5/09 potrebbe verificarsi un calo delle prestazioni e un aumento dei consumi in condizioni di utilizzo ridotto. Questo problema si verifica quando le CPU non entrano in stato di sospensione e quindi impediscono l'avvio delle funzioni di risparmio energetico dei sistemi in pausa. Non viene visualizzato nessun messaggio di errore.
Soluzione. Aggiungere la riga seguente al file /etc/system e riavviare il sistema:
set idle_cpu_prefer_mwait=0 |
Il comando fwflash standard richiede un plug-in per il supporto dell'aggiornamento firmware nel dispositivo flash ConnectX HCA. Il plug-in non è ancora disponibile nella versione Solaris 10 5/09.
Soluzione. È disponibile una versione indipendente dell'utility per consentire agli utenti di Solaris 10 di aggiornare il firmware. Procedere come segue:
Scaricare l'utility e la pagina man dal Customer Download Center all'indirizzo Web http://www.sun.com/download/index.jsp?tab=2. Nella pagina eseguire la ricerca di Solaris InfiniBand (IB) Updates 3. Seguire le istruzioni per scaricare il pacchetto ed eseguire la modifica dell'estensione tar dei file. Non installare il pacchetto: è necessario estrarre solo alcuni dei file.
Rinominare il file .tar originale:
# mv ib_updates_3_s10u6.i386.tar ib_updates_3_s10u6.i386.tar-orig |
Decomprimere il file .tar compresso:
#gunzip ib_updates_3_s10u6.i386.tgz |
Estrarre l'utility cxflash dal file .tar:
# tar -xvf ib_updates_3_s10u6.i386.tar usr/sbin/cxflash |
In tal modo verrà estratto il percorso corrispondente nella directory di lavoro:
# ls -lR usr usr: total 2 drwxrwxrwx 2 staff staff 512 Mar 9 09:20 sbin usr/sbin: total 88 -rwxr-xr-x 1 staff staff 44976 Jan 26 13:39 cxflash |
Copiare il file cxflash in /usr/sbin . L'utility può essere utilizzata per eseguire il flash del firmware in HCA hermon e ConnectX.
# ls -l firmware total 1952 -rw-r--r-- 1 staff staff 487336 Jan 30 18:29 SUN-375-3548_2.5.100.bin -rw-r--r-- 1 staff staff 487436 Jan 30 18:29 SUN-375-3549_2.5.100.bin |
La directory del firmware che viene creata al momento dell'estrazione dei file contiene i file del firmware per schede HCA e moduli Express di Sun. Se si dispone di versioni differenti della scheda HCA, procurarsi un firmware con revisione non precedente alla 2.5.000 dal fornitore di schede HCA.
L'output del comando zpool upgrade -v identifica i dispositivi di cache L2ARC come disponibili. Tuttavia, i dispositivi di cache non sono disponibili in Solaris 10 5/09. Vengono visualizzati vari messaggi di errore:
Se si cerca di aggiungere un dispositivo di cache nel corso della creazione di un pool di memorizzazione ZFS, viene visualizzato il seguente messaggio:
# zpool create pool mirror c1t1d0 c1t2d0 cache c1t3d0 cannot create 'pool': operation not supported on this type of pool |
Se si cerca di aggiungere un dispositivo di cache a un pool esistente, viene visualizzato il seguente messaggio:
# zpool add pool cache c1t3d0 cannot add to 'pool': pool must be upgraded to add these vdevs |
Soluzione. Nessuna.
Il driver bge non opera normalmente con il dispositivo HP NC326i. Non viene visualizzato nessun messaggio di errore.
Soluzione. Nessuna.
La regressione delle prestazioni si verifica per il driver NCP (Niagara Crypto Provider) sui sistemi Sun SPARC® Enterprise T5220 in cui è in esecuzione Solaris 10 5/09. Non viene visualizzato nessun messaggio di errore.
Soluzione. Aggiungere la riga seguente al file di configurazione /platform/sun4v/kernel/drv/ncp.conf:
ncp-threads-per-core=6; |
I dischetti non vengono attivati automaticamente quando vengono inseriti in un'unità USB. Non viene visualizzato nessun messaggio di errore. Il file system pcfs del dischetto risulta inaccessibile.
Soluzione. Attivare manualmente il file system sul dischetto con il comando mount. Ad esempio:
mount -F pcfs /vol/dev/dsk/c3t0d0/noname /rmdisk |
Il seguente messaggio di errore viene visualizzato quando si disconnette un dispositivo di storage USB:
Disconnected device was busy, please reconnect. |
Il messaggio viene visualizzato anche se la disattivazione ha successo.
Soluzione. Nessuna. Questo messaggio può essere ignorato.
Sui sistemi dotati di una grande quantità di memoria, ZFS può allocare la memoria del kernel su tutte le schede di sistema. Per la riconfigurazione dinamica è richiesta una scheda di sistema libera che sia in grado di ospitare la memoria della scheda che viene configurata dinamicamente. La riconfigurazione dinamica della memoria implica che non è possibile eseguire questa operazione sui sistemi con una grande quantità di memoria che eseguono ZFS. I server SunFireTM di fascia alta sono in grado di rilocare le pagine del server per evitare questo problema. Per i domini con oltre 32 core è necessario che la rilocazione delle pagine del kernel (KPR) sia abilitata su questi server. Non viene visualizzato nessun messaggio di errore
Soluzione. Ridurre la quantità di memoria del kernel che può essere allocata da ZFS impostando il parametro zfs_arc_max nel file /etc/system. L'esempio seguente imposta la dimensione massima su 512 Mbyte.
set zfs_arc_max = 0x20000000 |
Il sottocomando mpathadm show logical-unit elenca il valore di configurazione globale del bilanciamento del carico per la proprietà Current Load Balance. Tuttavia, le voci in csi_vhci.conf che modificano il tipo di bilanciamento del carico per uno specifico prodotto non vengono prese in considerazione nell'output di mpathadm anche quando l'impostazione è attiva.
Se i processi in background dello strumento di registrazione sono in esecuzione, i frame buffer Elite3D e Creator3D non riescono ad attivare la gestione dei consumi. Questa condizione riduce il risparmio energetico quando la gestione dei consumi è attiva. In alcune condizioni, anche l'esecuzione del comando sys-suspend può bloccarsi. Non viene visualizzato nessun messaggio di errore. È possibile che il sistema resti bloccato durante un'operazione di sospensione o ripresa del sistema.
Soluzione.
Eseguire il comando seguente circa 60 secondi dopo ogni login:
# pkill -f basicreg.jar # pkill -f swupna.jar |
Solaris 10 utilizza un nuovo framework crittografico. Tuttavia, le versioni 1.0 e 1.1 del software e del firmware della scheda Sun Crypto Accelerator 4000 non utilizzano questo framework. Queste versioni non sono perciò supportate in Solaris 10.
La versione 2.0 delle schede utilizza il nuovo framework. Questa versione è disponibile come aggiornamento gratuito per gli utenti delle schede Sun Crypto Accelerator 4000 che intendano utilizzare Solaris 10. Poiché la scheda Sun Crypto Accelerator 4000 è un prodotto soggetto a vincoli di esportazione, per ottenere l'aggiornamento gratuito è necessario contattare Sun Enterprise Services o il proprio canale di vendita locale. Altre informazioni sono disponibili alla pagina Web di Sun Crypto Accelerator 4000 nel sito dei prodotti Sun .
Il supporto di alcuni controller USB 2.0 è stato disabilitato a causa di problemi di incompatibilità tra questi dispositivi e il driver EHCI. Viene visualizzato il messaggio seguente:
Due to recently discovered incompatibilities with this USB controller, USB2.x transfer support has been disabled. This device will continue to function as a USB1.x controller. If you are interested in enabling USB2.x support please refer to the ehci(7D) man page. Please refer to www.sun.com/io for Solaris Ready products and to www.sun.com/bigadmin/hcl for additional compatible USB products. |
Per le informazioni più aggiornate sui dispositivi USB, vedere http://www.sun.com/io_technologies/USB-Faq.html.
Questa versione di Solaris supporta sia i dispositivi USB 1.1 che USB 2.0. La tabella seguente contiene un riepilogo dei dispositivi USB che operano correttamente in determinate configurazioni. La connessione può essere sia diretta che tramite un hub USB. Si noti che i dispositivi e gli hub USB 1.1 possono avere due modalità: bassa velocità e velocità normale. Tutti i dispositivi USB 2.0 sono ad alta velocità. Per informazioni dettagliate sulle porte e le velocità di utilizzo, vedere il manuale System Administration Guide: Devices and File Systems .
Tabella 2–1 Dispositivi e configurazioni USB
Dispositivi USB |
Connessione |
---|---|
Dispositivi di memorizzazione USB 2.0 |
Diretta, hub USB 1.1, hub USB 2.0 |
Dispositivi USB 1.1 fatta eccezione per i dispositivi audio |
Diretta, hub USB 1.1, hub USB 2.0 |
Dispositivi audio USB 1.1 |
Diretta, hub USB 1.1 |
Dispositivi audio USB 2.0 |
Non supportata |
Qui di seguito sono descritte le limitazioni connesse ad alcuni driver e interfacce riscontrate in questa versione di Solaris 10 per piattaforma x86:
Questa funzionalità è disabilitata per tutti i tipi di dispositivo. Nel codice DDI_SUSPEND della funzione detach(), si dovrebbe restituire DDI_FAILURE.
Questa funzionalità non è disponibile per i dispositivi USB. Non creare componenti per la gestione dei consumi. Scrivere il driver in modo che pm_raise_power() e pm_lower_power() vengano chiamati solo se vengono creati componenti per la gestione dei consumi.
La gestione dei consumi dei dispositivi interattivi, ad esempio dei lettori di supporti removibili, è collegata a quella del monitor e della relativa scheda grafica. Se lo schermo è attivo, il lettore di CD-ROM e l'unità a dischetti rimangono nella modalità pienamente operativa. Questi dispositivi possono passare erroneamente alla modalità di risparmio energetico sui sistemi senza monitor. Per ripristinare l'alimentazione del lettore di CD o dell'unità a dischetti, digitare volcheck per ottenere lo stato più recente di ogni dispositivo removibile.
In alternativa, è possibile disabilitare la gestione dei consumi usando l'interfaccia grafica di Dtpower. Disabilitando la gestione dei consumi, i dispositivi operano sempre in modalità pienamente operativa.
Nella configurazione predefinita, il programma kdmconfig specifica la tastiera generica inglese a 104 tasti come tipo di tastiera collegata al sistema. Se il sistema non utilizza una tastiera inglese, è necessario specificare manualmente il tipo di tastiera appropriato durante l'installazione. Diversamente, l'installazione continua usando una tastiera predefinita diversa da quella effettiva del sistema.
Soluzione 1. Se il sistema non utilizza una tastiera inglese, procedere come segue durante l'installazione:
Quando compare la configurazione del sistema a finestre proposta per l'installazione, premere Esc.
Le informazioni di questa schermata, che includono il tipo di tastiera, rimangono visualizzate solo per 30 secondi. Per modificare le impostazioni di configurazione, è necessario premere Esc prima che trascorrano i 30 secondi. Diversamente, l'installazione prosegue con le impostazioni visualizzate.
Scegliere il tipo di tastiera corrispondente alla tastiera collegata al sistema.
Premere Invio per accettare le modifiche e continuare l'installazione.
Soluzione 2. Per cambiare il tipo di tastiera su un sistema che già utilizza Solaris 10, usare il programma kdmconfig. Scegliere l'opzione appropriata per il tipo di server X eseguito dal sistema.
Se il sistema utilizza il server Xsun, procedere come segue:
Eseguire kdmconfig.
Usare l'opzione di modifica della tastiera.
Salvare la configurazione.
Se il sistema utilizza il server Xorg predefinito, procedere come segue:
Eseguire kdmconfig.
Selezionare il server Xsun.
Usare l'opzione di modifica della tastiera.
Salvare la configurazione.
Eseguire nuovamente kdmconfig per passare al server Xorg.
Il driver jfca per i controller (HBA) sotto elencati può causare errori irreversibili del sistema o errori di I/O quando i controller sono collegati a un'unità nastro:
SG-PCI1FC-JF2
SG-PCI2FC-JF2
Durante lo svolgimento di alcune operazioni, il driver jfca per queste schede bus è soggetto a una condizione di conflitto (race condition) che causa un errore. Le operazioni interessate sono le seguenti:
Ripristino dei link
Ripristino dei cicli
Ripristino degli switch
Errori ripetuti nei link
Vengono visualizzati messaggi di errore simili ai seguenti:
Messaggi di errore di I/O
jfca: [ID 277337 kern.info] jfca4: Sequencer-detected error. Recover immediately. last message repeated 18376 times jfca: [ID 716917 kern.notice] jfca4: ExgWarning: SendVerify(1): SHOULD ABORT THE ORIG I/O PKG=30007520bd8! scsi: [ID 107833 kern.warning] WARNING: /pci@1e,600000/SUNW,jfca@3,1/fp@0,0/st@w2100001086108 628,1 (st3): SCSI transport failed: reason 'timeout': giving up |
Messaggi di errore irreversibile del sistema
panic[cpu1]/thread=2a100497cc0: BAD TRAP: type=31 rp=2a1004978d0 addr=a8 mmu_fsr=0 occurred in module "jfca" due to a NULL pointer dereference |
Soluzione. Non collegare le unità nastro a una scheda SG-PCI1FC-JF2 o SG-PCI2FC-JF2.
Le schede Quad Fast-Ethernet (QFE) possono creare problemi di conflitto se condividono lo stesso bus con una delle seguenti schede:
Sun GigaSwift
Sun Dual Gigabit Ethernet e Dual SCSI/P
Sun Quad Gigaswift Ethernet
Nella configurazione predefinita, il parametro infinite-burst del driver ce utilizzato da queste schede è abilitato. Ciò comporta la riduzione al minimo del tempo del bus disponibile per le porte QFE che condividono lo stesso bus.
Soluzione. Evitare di collocare le schede QFE sullo stesso bus delle schede di rete elencate.
Il valore di timeout predefinito per la parte SCSI della scheda SunSwiftTM PCI Ethernet/SCSI (X1032A) non è conforme ai requisiti di timeout del lettore di DVD-ROM SCSI di Sun (X6168A). Con supporti di scarsa qualità, il DVD-ROM produce talvolta errori di timeout. Le uniche eccezioni sono rappresentate dai sistemi Sun Fire 6800, 4810, 4800 e 3800. Questi sistemi modificano il valore di timeout SCSI attraverso la PROM OpenBoot.
Soluzione. Per le altre piattaforme, usare le interfacce SCSI integrate o schede SCSI compatibili con il DVD-ROM, come le seguenti:
X1018A (SBus: F501-2739-xx)
X6540A (PCI: F375-0005-xx)