Supplemento alle note su Solaris 8 2/02 per hardware Sun

Errori noti

cryptorand si chude dopo la rimozione della scheda CPU con il software DR (ID 4456095)

Descrizione: se un sistema sta eseguendo il processo cryptorand del package SUNWski, una deconfigurazione della memoria, come parte della disconnessione di una scheda CPU/memoria (SB), fa sì che cryptorand si chiuda con i messaggi registrati in /var/adm/messages. Questa azione impedisce ai servizi di assegnazione di numeri generati casualmente di rendere sicuri i sottosistemi, pertanto non si dovrebbe deconfigurare la memoria presente quando cryptorand è avviato.

Il processo cryptorand fornisce un numero generato casualmente per /dev/random. Una volta avviato cryptorand, il tempo necessario prima che /dev/random diventi disponibile dipende dalla quantità di memoria del sistema. Possono essere richiesti circa due minuti per ogni GB di memoria. Le applicazioni che utilizzano /dev/random per ricavare numeri casuali possono essere interessate da un blocco temporaneo. Non è necessario riavviare cryptorand se viene aggiunta una scheda CPU/memoria a un dominio.

Soluzione: se viene rimossa dal dominio una scheda CPU/memoria, riavviare cryptorand immettendo il comando seguente come superutente:

# sh /etc/init.d/cryptorand start

SBM talvolta causa un errore panic del sistema durante le operazioni di DR (ID 4506562)

Descrizione: si può verificare un errore di tipo panic quando una scheda di sistema contenente CPU viene rimossa dal sistema mentre è in uso Solaris Bandwidth Manager (SBM).

Soluzione: non installare SBM sui sistemi che saranno utilizzati per le prove di DR e non eseguire le operazioni di DR della scheda di sistema con CPU su sistemi su cui è installato SBM.

Blocco di DR durante l'operazione di configurazione con la scheda IB con vxdmpadm policy=check_all (ID 4509462)

Descrizione: un'operazione di configurazione di DR si blocca con una scheda IBx (I/O) dopo alcune iterazioni riuscite. Questa situazione si verifica quando l'operazione di DR viene eseguita simultaneamente al daemon DMP che implementa la politica check_all con un intervallo di tempo.

Soluzione: per evitare lo stallo tra il daemon DMP e la riconfigurazione dinamica della scheda di sistema, immettere il comando seguente prima di eseguire le operazioni di DR. Questo comando arresta e riavvia il daemon DMP.

# /usr/sbin/vxdmpadm stop restore

Impossibile scollegare i controller SCSI con il software DR (ID 4446253)

Descrizione: quando un controller SCSI è configurato ma non occupato, non può essere scollegato utilizzando il comando di DR cfgadm(1M).

Soluzione: nessuna.

Plugin cfgadm_sbd interrotto in ambiente multithreading (ID 4498600)

Descrizione: quando un client in multithreading della libreria cfgadm emette richieste sbd simultanee, il sistema può bloccarsi.

Soluzione: nessuna. Attualmente non vi sono applicazioni che implementino l'uso in multithreading della libreria cfgadm.

Le operazioni di DR si bloccano dopo alcuni loop quando è in esecuzione anche CPU Power Control (ID 4114317)

Descrizione: quando si verificano simultaneamente più operazioni di DR, o quando psradm viene eseguito contemporaneamente a un'operazione di DR, il sistema può bloccarsi a causa di un errore di abbraccio mortale mutex.

Soluzione: eseguire le operazioni di DR in serie (ovvero, un'operazione di DR per volta) e lasciare che ognuna di esse venga completata correttamente prima di eseguire psradm, oppure prima di iniziare un'altra operazione di DR.

ERRORE del bus di console SC mentre SNMP è abilitato con la suite DR in esecuzione (ID 4485505)

Descrizione: talvolta viene generato un messaggio di errore del bus di console durante le operazioni get di SNMP sull'oggetto cpuModDescr. Questa condizione non si verifica frequentemente e solo quando SunMC sta monitorando un sistema. Quando si verifica il messaggio, a SunMC viene restituito unknown come valore dell'oggetto cpuModDescr.

Soluzione: l'unica soluzione consiste nel non utilizzare SunMC. Tuttavia, il messaggio non è pericoloso e il problema si verifica raramente, quindi si può semplicemente ignorarlo. L'unico rischio è che la GUI di SunMC può occasionalmente visualizzare il valore errato per cpuModDescr.

Possibile errore panic del sistema una volta esaurito il timeout di send_mondo_set (ID 4518324)

Può presentarsi un errore panic del sistema Sun Fire se una o più delle schede CPU sono messe in pausa sync durante un'operazione di DR. La pausa sync è richiesta per collegare o scollegare le schede. Se vi sono interrupt mondo in sospeso e per qualsiasi motivo SC non è in grado di completare la pausa sync entro il limite send_mondo timeout di un secondo, il sistema produce l'errore panic.