Gestión de dispositivos en Oracle® Solaris 11.2

Salir de la Vista de impresión

Actualización: Julio de 2014
 
 

Resolución de dispositivos defectuosos

Un mecanismo de extracción de dispositivos aísla al dispositivo marcado como defectuoso mediante la estructura de administración de errores (FMA). Esta función permite la desactivación automática y segura de dispositivos anómalos, para evitar la pérdida de información, el deterioro de los datos o los avisos de error grave y los tiempos de inactividad del sistema. El proceso de extracción tiene en cuenta la estabilidad del sistema una vez extraído el dispositivo.

Los dispositivos de mayor importancia nunca se extraen. Si necesita sustituir manualmente un dispositivo extraído, use el comando fmadm repair después de la sustitución del dispositivo, para que el sistema sepa que el dispositivo se ha sustituido.

Para obtener más información, consulte fmadm(1M).

Cuando se retira un dispositivo, se muestra un mensaje similar al siguiente en la consola y se registra en el archivo /var/adm/messages.

Aug 9 18:14 starbug genunix: [ID 751201 kern.notice] \
     NOTICE: One or more I/O devices have been retired

Puede usar el comando prtconf para identificar dispositivos extraídos específicos. Por ejemplo:

# prtconf
.
.
.
pci, instance #2
scsi, instance #0
disk (driver not attached)
tape (driver not attached)
sd, instance #3
sd, instance #0 (retired)
scsi, instance #1 (retired)
disk (retired)
tape (retired)
pci, instance #3
network, instance #2 (driver not attached)
network, instance #3 (driver not attached)
os-io (driver not attached)
iscsi, instance #0
pseudo, instance #0
.
.
.

Cómo resolver un dispositivo defectuoso

Lleve a cabo los siguientes pasos para resolver un dispositivo defectuoso o un dispositivo que ha sido quitado.

  1. Identifique el dispositivo defectuoso mediante el comando fmadm faulty. Por ejemplo:
    # fmadm faulty
    --------------- ------------------------------------  -------------- ---------
    TIME            EVENT-ID                              MSG-ID SEVERITY
    --------------- ------------------------------------  -------------- ---------
    Jun 20 16:30:52 55c82fff-b709-62f5-b66e-b4e1bbe9dcb1  ZFS-8000-LR Major
    
    Problem Status    : solved
    Diag Engine       : zfs-diagnosis / 1.0
    System
    Manufacturer  : unknown
    Name          : ORCL,SPARC-T3-4
    Part_Number   : unknown
    Serial_Number : 1120BDRCCD
    Host_ID       : 84a02d28
    
    ----------------------------------------
    Suspect 1 of 1 :
    Fault class : fault.fs.zfs.open_failed
    Certainty   : 100%
    Affects     : zfs://pool=86124fa573cad84e/vdev=25d36cd46e0a7f49/
    pool_name=pond/vdev_name=id1,sd@n5000c500335dc60f/a
    Status      : faulted and taken out of service
    
    FRU
    Name             : "zfs://pool=86124fa573cad84e/vdev=25d36cd46e0a7f49/
    pool_name=pond/vdev_name=id1,sd@n5000c500335dc60f/a"
    Status        : faulty
    
    Description : ZFS device 'id1,sd@n5000c500335dc60f/a' in pool 'pond' failed to
    open.
    
    Response    : An attempt will be made to activate a hot spare if available.
    
    Impact      : Fault tolerance of the pool may be compromised.
    
    Action      : Use 'fmadm faulty' to provide a more detailed view of this event.
    Run 'zpool status -lx' for more information. Please refer to the
    associated reference document at
    http://support.oracle.com/msg/ZFS-8000-LR for the latest service
    procedures and policies regarding this diagnosis.
  2. Sustituya el dispositivo defectuoso o quitado o elimine el error del dispositivo. Por ejemplo:
    # zpool clear pond c0t5000C500335DC60Fd0

    Si se produjo un error de dispositivo intermitente, pero no se reemplazó el dispositivo, puede intentar borrar el error anterior.

  3. Elimine la falla de FMA. Por ejemplo:
    # fmadm repaired zfs://pool=86124fa573cad84e/vdev=25d36cd46e0a7f49/ \
    pool_name=pond/vdev_name=id1,sd@n5000c500335dc60f/a
    fmadm: recorded repair to of zfs://pool=86124fa573cad84e/vdev=25d36cd46e0a7f49/
    pool_name=pond/vdev_name=id1,sd@n5000c500335dc60f/a
  4. Confirme que la falla se haya eliminado.
    # fmadm faulty

    Si se borra el error, el comando fmadm faulty no devuelve nada.