고장난 장치 해결

장치 회수 방식의 경우, FMA(고장 관리 프레임워크)에 따라 고장으로 플래그 지정된 장치를 격리합니다. 이 기능을 사용하면 고장난 장치를 안전하게 자동으로 비활성화하여 데이터 손실, 데이터 손상, 패닉 및 시스템 정지를 방지할 수 있습니다. 제거 프로세스는 장치가 제거된 후 시스템의 안정성을 고려합니다.

중요한 장치는 제거되지 않습니다. 제거된 장치를 수동으로 교체해야 하는 경우 시스템에서 장치가 교체된 것을 인식할 수 있도록 장치를 교체한 후 fmadm repair 명령을 사용합니다.

장치가 제거되면 다음과 비슷한 메시지가 콘솔에 표시되고 /var/adm/messages 파일에 기록됩니다.

Aug 9 18:14 starbug genunix: [ID 751201 kern.notice] \
     NOTICE: One or more I/O devices have been retired

prtconf 명령을 사용하여 제거된 특정 장치를 식별할 수 있습니다. 예를 들면 다음과 같습니다.

# prtconf
pci, instance #2
scsi, instance #0
disk (driver not attached)
tape (driver not attached)
sd, instance #3
sd, instance #0 (retired)
scsi, instance #1 (retired)
disk (retired)
tape (retired)
pci, instance #3
network, instance #2 (driver not attached)
network, instance #3 (driver not attached)
os-io (driver not attached)
iscsi, instance #0
pseudo, instance #0

고장난 장치를 해결하는 방법

다음 단계에 따라 고장난 장치 또는 회수 장치를 해결합니다.

  1. fmadm faulty 명령을 사용하여 고장난 장치를 식별합니다. 예를 들면 다음과 같습니다.
    # fmadm faulty
    --------------- ------------------------------------  -------------- ---------
    TIME            EVENT-ID                              MSG-ID SEVERITY
    --------------- ------------------------------------  -------------- ---------
    Jun 20 16:30:52 55c82fff-b709-62f5-b66e-b4e1bbe9dcb1  ZFS-8000-LR Major
    Problem Status    : solved
    Diag Engine       : zfs-diagnosis / 1.0
    Manufacturer  : unknown
    Name          : ORCL,SPARC-T3-4
    Part_Number   : unknown
    Serial_Number : 1120BDRCCD
    Host_ID       : 84a02d28
    Suspect 1 of 1 :
    Fault class : fault.fs.zfs.open_failed
    Certainty   : 100%
    Affects     : zfs://pool=86124fa573cad84e/vdev=25d36cd46e0a7f49/
    Status      : faulted and taken out of service
    Name             : "zfs://pool=86124fa573cad84e/vdev=25d36cd46e0a7f49/
    Status        : faulty
    Description : ZFS device 'id1,sd@n5000c500335dc60f/a' in pool 'pond' failed to
    Response    : An attempt will be made to activate a hot spare if available.
    Impact      : Fault tolerance of the pool may be compromised.
    Action      : Use 'fmadm faulty' to provide a more detailed view of this event.
    Run 'zpool status -lx' for more information. Please refer to the
    associated reference document at for the latest service
    procedures and policies regarding this diagnosis.
  2. 고장난 장치 또는 회수 장치를 교체하거나 장치 오류를 해결합니다. 예를 들면 다음과 같습니다.
    # zpool clear pond c0t5000C500335DC60Fd0

    간헐적으로 장치 오류가 발생하는데 장치를 교체하지 않은 경우 이전의 오류를 해결할 수 있습니다.

  3. FMA 고장을 해결합니다. 예를 들면 다음과 같습니다.
    # fmadm repaired zfs://pool=86124fa573cad84e/vdev=25d36cd46e0a7f49/ \
    fmadm: recorded repair to of zfs://pool=86124fa573cad84e/vdev=25d36cd46e0a7f49/
  4. 고장이 해결된 것을 확인합니다.
    # fmadm faulty

    오류가 해결되면 fmadm faulty 명령이 아무것도 반환하지 않습니다.