Nuove funzioni di Solaris 10

Funzione di ritiro dei dispositivi con errori

A partire da Solaris 10 10/08, Solaris include un nuovo meccanismo di ritiro dei dispositivi con il quale il framework di gestione degli errori (FMA) può isolare i dispositivi in cui rileva un malfunzionamento (faulty). Questa funzione permette di disattivare in modo automatico e sicuro i dispositivi malfunzionanti per evitare la perdita o il danneggiamento dei dati, errori irreversibili o interruzioni del sistema. Il processo di ritiro si svolge in modo sicuro, garantendo la stabilità del sistema dopo la disattivazione del dispositivo.

I dispositivi di importanza critica non vengono mai ritirati. Se occorre sostituire manualmente un dispositivo ritirato, al termine della procedura di sostituzione eseguire il comando fmadm repair per comunicare al sistema che il dispositivo è stato sostituito.

Il processo di riparazione fmadm prevede le seguenti operazioni:

Per maggiori informazioni, vedere la pagina man fmadm(1M).

Il ritiro dei dispositivi viene segnalato da un messaggio generico, che viene visualizzato sulla console e scritto nel file /var/adm/messages. Ad esempio:


Aug 9 18:14 starbug genunix: [ID 751201 kern.notice] 
NOTICE: One or more I/O devices have been retired

Per identificare gli specifici dispositivi ritirati è possibile utilizzare il comando prtconf. Ad esempio:


# prtconf
.
.
.
pci, instance #2
        scsi, instance #0
            disk (driver not attached)
            tape (driver not attached)
            sd, instance #3
            sd, instance #0 (retired)
        scsi, instance #1 (retired)
            disk (retired)
            tape (retired)
    pci, instance #3
        network, instance #2 (driver not attached)
        network, instance #3 (driver not attached)
    os-io (driver not attached)
    iscsi, instance #0
    pseudo, instance #0
.
.
.