Un mecanismo de extracción de dispositivos aísla al dispositivo marcado como defectuoso mediante la estructura de administración de errores (FMA). Esta función permite la desactivación automática y segura de dispositivos anómalos, para evitar la pérdida de información, el deterioro de los datos o los avisos de error grave y los tiempos de inactividad del sistema. El proceso de extracción tiene en cuenta la estabilidad del sistema una vez extraído el dispositivo.
Los dispositivos de mayor importancia nunca se extraen. Si necesita sustituir manualmente un dispositivo extraído, use el comando fmadm repair después de la sustitución del dispositivo, para que el sistema sepa que el dispositivo se ha sustituido.
Para obtener más información, consulte fmadm(1M).
Cuando se retira un dispositivo, se muestra un mensaje similar al siguiente en la consola y se registra en el archivo /var/adm/messages.
Aug 9 18:14 starbug genunix: [ID 751201 kern.notice] \ NOTICE: One or more I/O devices have been retired
Puede usar el comando prtconf para identificar dispositivos extraídos específicos. Por ejemplo:
# prtconf . . . pci, instance #2 scsi, instance #0 disk (driver not attached) tape (driver not attached) sd, instance #3 sd, instance #0 (retired) scsi, instance #1 (retired) disk (retired) tape (retired) pci, instance #3 network, instance #2 (driver not attached) network, instance #3 (driver not attached) os-io (driver not attached) iscsi, instance #0 pseudo, instance #0 . . .
Lleve a cabo los siguientes pasos para resolver un dispositivo defectuoso o un dispositivo que ha sido quitado.
# fmadm faulty --------------- ------------------------------------ -------------- --------- TIME EVENT-ID MSG-ID SEVERITY --------------- ------------------------------------ -------------- --------- Jun 20 16:30:52 55c82fff-b709-62f5-b66e-b4e1bbe9dcb1 ZFS-8000-LR Major Problem Status : solved Diag Engine : zfs-diagnosis / 1.0 System Manufacturer : unknown Name : ORCL,SPARC-T3-4 Part_Number : unknown Serial_Number : 1120BDRCCD Host_ID : 84a02d28 ---------------------------------------- Suspect 1 of 1 : Fault class : fault.fs.zfs.open_failed Certainty : 100% Affects : zfs://pool=86124fa573cad84e/vdev=25d36cd46e0a7f49/ pool_name=pond/vdev_name=id1,sd@n5000c500335dc60f/a Status : faulted and taken out of service FRU Name : "zfs://pool=86124fa573cad84e/vdev=25d36cd46e0a7f49/ pool_name=pond/vdev_name=id1,sd@n5000c500335dc60f/a" Status : faulty Description : ZFS device 'id1,sd@n5000c500335dc60f/a' in pool 'pond' failed to open. Response : An attempt will be made to activate a hot spare if available. Impact : Fault tolerance of the pool may be compromised. Action : Use 'fmadm faulty' to provide a more detailed view of this event. Run 'zpool status -lx' for more information. Please refer to the associated reference document at http://support.oracle.com/msg/ZFS-8000-LR for the latest service procedures and policies regarding this diagnosis.
# zpool clear pond c0t5000C500335DC60Fd0
Si se produjo un error de dispositivo intermitente, pero no se reemplazó el dispositivo, puede intentar borrar el error anterior.
# fmadm repaired zfs://pool=86124fa573cad84e/vdev=25d36cd46e0a7f49/ \ pool_name=pond/vdev_name=id1,sd@n5000c500335dc60f/a fmadm: recorded repair to of zfs://pool=86124fa573cad84e/vdev=25d36cd46e0a7f49/ pool_name=pond/vdev_name=id1,sd@n5000c500335dc60f/a
# fmadm faulty
Si se borra el error, el comando fmadm faulty no devuelve nada.