Questa sezione contiene una breve descrizione e i numeri di ID Sun degli errori più importanti rilevati durante il testing del software DR. L'elenco a seguire non è da considerarsi esaustivo.
Descrizione: se un sistema sta eseguendo il processo cryptorand del package SUNWski, una deconfigurazione della memoria, come parte della disconnessione di una scheda CPU/memoria (SB), fa sì che cryptorand si chiuda con i messaggi registrati in /var/adm/messages. Questa azione impedisce ai servizi di assegnazione di numeri generati casualmente di rendere sicuri i sottosistemi, pertanto non si dovrebbe deconfigurare la memoria presente quando cryptorand è avviato.
Il processo cryptorand fornisce un numero generato casualmente per /dev/random. Una volta avviato cryptorand, il tempo necessario prima che /dev/random diventi disponibile dipende dalla quantità di memoria del sistema. Possono essere richiesti circa due minuti per ogni GB di memoria. Le applicazioni che utilizzano /dev/random per ricavare numeri casuali possono essere interessate da un blocco temporaneo. Non è necessario riavviare cryptorand se viene aggiunta una scheda CPU/memoria a un dominio.
Soluzione: se viene rimossa dal dominio una scheda CPU/memoria, riavviare cryptorand immettendo il comando seguente come superutente:
# sh /etc/init.d/cryptorand start |
Descrizione: si può verificare un errore di tipo panic quando una scheda di sistema contenente CPU viene rimossa dal sistema mentre è in uso Solaris Bandwidth Manager (SBM).
Soluzione: non installare SBM sui sistemi che saranno utilizzati per le prove di DR e non eseguire le operazioni di DR della scheda di sistema con CPU su sistemi su cui è installato SBM.
Descrizione: un'operazione di configurazione di DR si blocca con una scheda IBx (I/O) dopo alcune iterazioni riuscite. Questa situazione si verifica quando l'operazione di DR viene eseguita simultaneamente al daemon DMP che implementa la politica check_all con un intervallo di tempo.
Soluzione: per evitare lo stallo tra il daemon DMP e la riconfigurazione dinamica della scheda di sistema, immettere il comando seguente prima di eseguire le operazioni di DR. Questo comando arresta e riavvia il daemon DMP.
# /usr/sbin/vxdmpadm stop restore |
Descrizione: quando un controller SCSI è configurato ma non occupato, non può essere scollegato utilizzando il comando di DR cfgadm(1M).
Soluzione: nessuna.
Descrizione: quando un client in multithreading della libreria cfgadm emette richieste sbd simultanee, il sistema può bloccarsi.
Soluzione: nessuna. Attualmente non vi sono applicazioni che implementino l'uso in multithreading della libreria cfgadm.
Descrizione: quando si verificano simultaneamente più operazioni di DR, o quando psradm viene eseguito contemporaneamente a un'operazione di DR, il sistema può bloccarsi a causa di un errore di abbraccio mortale mutex.
Soluzione: eseguire le operazioni di DR in serie (ovvero, un'operazione di DR per volta) e lasciare che ognuna di esse venga completata correttamente prima di eseguire psradm, oppure prima di iniziare un'altra operazione di DR.
Descrizione: talvolta viene generato un messaggio di errore del bus di console durante le operazioni get di SNMP sull'oggetto cpuModDescr. Questa condizione non si verifica frequentemente e solo quando SunMC sta monitorando un sistema. Quando si verifica il messaggio, a SunMC viene restituito unknown come valore dell'oggetto cpuModDescr.
Soluzione: l'unica soluzione consiste nel non utilizzare SunMC. Tuttavia, il messaggio non è pericoloso e il problema si verifica raramente, quindi si può semplicemente ignorarlo. L'unico rischio è che la GUI di SunMC può occasionalmente visualizzare il valore errato per cpuModDescr.
Può presentarsi un errore panic del sistema Sun Fire se una o più delle schede CPU sono messe in pausa sync durante un'operazione di DR. La pausa sync è richiesta per collegare o scollegare le schede. Se vi sono interrupt mondo in sospeso e per qualsiasi motivo SC non è in grado di completare la pausa sync entro il limite send_mondo timeout di un secondo, il sistema produce l'errore panic.