Nuove funzioni di Solaris Express Developer Edition

Funzione di ritiro dei dispositivi con errori

Questo miglioramento alle funzioni di gestione dei dispositivi è stato introdotto nella versione Developer 1/08.

A partire da questa versione, Solaris include un nuovo meccanismo di ritiro dei dispositivi con il quale il framework di gestione degli errori (FMA) può isolare i dispositivi in cui rileva un errore di funzionamento (faulty). Questa funzione permette di disattivare in modo automatico e sicuro i dispositivi malfunzionanti per evitare la perdita o il danneggiamento dei dati, errori irreversibili o interruzioni del sistema. Il processo di ritiro si svolge in modo sicuro, garantendo la stabilità del sistema dopo la disattivazione del dispositivo.

I dispositivi di importanza critica non vengono mai ritirati. Se occorre sostituire manualmente un dispositivo ritirato, al termine della procedura di sostituzione eseguire il comando fmadm repair per comunicare al sistema che il dispositivo è stato sostituito.

Il processo di riparazione fmadm prevede le seguenti operazioni:

Per maggiori informazioni, vedere la pagina man fmadm(1M).

Il ritiro dei dispositivi viene segnalato da un messaggio generico, che viene visualizzato sulla console e scritto nel file /var/adm/messages. Ad esempio:


Aug 9 18:14 starbug genunix: [ID 751201 kern.notice] 
NOTICE: One or more I/O devices have been retired

Per identificare gli specifici dispositivi ritirati è possibile utilizzare il comando prtconf. Ad esempio:


# prtconf
.
.
.
pci, instance #2
        scsi, instance #0
            disk (driver not attached)
            tape (driver not attached)
            sd, instance #3
            sd, instance #0 (retired)
        scsi, instance #1 (retired)
            disk (retired)
            tape (retired)
    pci, instance #3
        network, instance #2 (driver not attached)
        network, instance #3 (driver not attached)
    os-io (driver not attached)
    iscsi, instance #0
    pseudo, instance #0
.
.
.