Oracle® Solaris 11.2의 ZFS 파일 시스템 관리

인쇄 보기 종료

업데이트 날짜: 2014년 12월
 
 

ZFS 저장소 풀의 건전성 상태 확인

ZFS는 풀 및 장치 건전성을 조사하는 통합된 방법을 제공합니다. 풀의 건전성은 모든 장치의 상태에서 결정됩니다. 이 상태 정보는 zpool status 명령을 사용하여 표시됩니다. 또한 잠재적인 풀 및 장치 실패가 fmd에 의해 보고되고, 시스템 콘솔에 표시되며, /var/adm/messages 파일에 기록됩니다.

이 절에서는 풀 및 장치 건전성을 확인하는 방법을 설명합니다. 이 장에서는 건전하지 않은 풀에서 복구하는 방법을 다루지 않습니다. 문제 해결 및 데이터 복구에 대한 자세한 내용은 Chapter 10, Oracle Solaris ZFS 문제 해결 및 풀 복구를 참조하십시오.

풀의 건전성 상태는 다음 4개 상태 중 하나로 설명됩니다.

DEGRADED

결함이 있는 장치가 한 개 이상이지만 중복 구성으로 인해 데이터는 계속 사용할 수 있는 풀입니다.

ONLINE

모든 장치가 정상적으로 작동 중인 풀입니다.

SUSPENDED

장치 연결 복원을 기다리는 중인 풀입니다. 풀은 장치 문제가 해결될 때까지 SUSPENDED 상태를 유지합니다.

UNAVAIL

메타 데이터가 손상되었거나 하나 이상의 장치가 사용할 수 없는 상태이고 작동을 계속하기 위해 필요한 복제본이 부족한 상태의 풀입니다.

각 풀 장치는 다음 상태 중 하나에 속할 수 있습니다.

DEGRADED

가상 장치에서 실패가 발생하지만 여전히 작동 가능합니다. 이 상태는 미러 또는 RAID-Z 장치가 하나 이상의 구성 장치를 잃을 때 가장 일반적으로 나타납니다. 다른 장치에서 다음에 발생하는 결함을 복구할 수 없는 경우 풀의 내결함성이 침해될 수 있습니다.

OFFLINE

장치가 관리자에 의해 명시적으로 오프라인으로 전환되었습니다.

ONLINE

장치 또는 가상 장치가 정상적으로 작동하는 상태입니다. 일부 일시적인 오류가 계속 발생할 수 있지만 장치가 정상적으로 작동하는 중입니다.

REMOVED

시스템이 실행되는 동안 장치가 물리적으로 제거되었습니다. 장치 제거 감지는 하드웨어에 따라 다르며 일부 플랫폼에서 지원되지 않을 수 있습니다.

UNAVAIL

장치 또는 가상 장치를 열 수 없습니다. 경우에 따라 UNAVAIL 장치가 있는 풀이 DEGRADED 모드로 나타날 수 있습니다. 최상위 레벨 가상 장치가 UNAVAIL 상태이면 풀에서 아무것도 액세스할 수 없습니다.

풀의 건전성은 모든 최상위 레벨 가상 장치의 건전성에서 결정됩니다. 모든 가상 장치가 ONLINE이면 풀도 ONLINE입니다. 가상 장치 중 하나라도 DEGRADED 또는 UNAVAIL이면 풀도 DEGRADED입니다. 최상위 가상 장치가 UNAVAIL 또는 OFFLINE 상태이면 이 풀도 UNAVAIL 또는 SUSPENDED 상태입니다. UNAVAIL 또는 SUSPENDED 상태의 풀은 완전히 액세스할 수 없습니다. 필요한 장치가 연결되거나 복구될 때까지 데이터를 복구할 수 없습니다. DEGRADED 상태의 풀은 계속해서 실행되지만, 풀이 온라인일 때만큼 동일한 레벨의 데이터 중복성 또는 데이터 처리량을 기대할 수 없습니다.

zpool status 명령은 리실버링 및 스크러빙 작업에 대한 세부 정보도 제공합니다.

  • 리실버링 진행 중 보고입니다. 예를 들면 다음과 같습니다.

    scan: resilver in progress since Wed Jun 20 14:19:38 2012
    7.43G scanned
    7.43G resilvered at 26.8M/s, 10.35% done, 0h30m to go
  • 스크러빙 진행 중 보고입니다. 예를 들면 다음과 같습니다.

    scan: scrub in progress since Wed Jun 20 14:56:52 2012
    529M scanned out of 71.8G at 48.1M/s, 0h25m to go
    0 repaired, 0.72% done
  • 리실버링 완료 메시지입니다. 예를 들면 다음과 같습니다.

    scan: resilvered 71.8G in 0h14m with 0 errors on Wed Jun 20 14:33:42 2012
  • 스크러빙 완료 메시지입니다. 예를 들면 다음과 같습니다.

    scan: scrub repaired 0 in 0h11m with 0 errors on Wed Jun 20 15:08:23 2012
  • 진행 중인 스크러빙 취소 메시지입니다. 예를 들면 다음과 같습니다.

    scan: scrub canceled on Wed Jun 20 16:04:40 2012
  • 스크러빙 및 리실버링 완료 메시지는 시스템 재부트 시에도 지속됩니다.

기본 저장소 풀 건전성 상태

다음과 같이 zpool status 명령을 사용하여 풀 건전성 상태를 빠르게 검토할 수 있습니다.

# zpool status -x
all pools are healthy

명령 구문에 풀 이름을 지정하면 특정 풀을 조사할 수 있습니다. ONLINE 상태에 있지 않은 모든 풀은 다음 절에 설명된 대로 잠재적인 문제를 조사해야 합니다.

자세한 건전성 상태

–v 옵션을 사용하여 더 자세한 건전성 요약 상태를 요청할 수 있습니다. 예를 들면 다음과 같습니다.

# zpool status -v pond
pool: pond
state: DEGRADED
status: One or more devices are unavailable in response to persistent errors.
Sufficient replicas exist for the pool to continue functioning in a
degraded state.
action: Determine if the device needs to be replaced, and clear the errors
using 'zpool clear' or 'fmadm repaired', or replace the device
with 'zpool replace'.
scan: scrub repaired 0 in 0h0m with 0 errors on Wed Jun 20 15:38:08 2012
config:

NAME                       STATE     READ WRITE CKSUM
pond                       DEGRADED     0     0     0
mirror-0                   DEGRADED     0     0     0
c0t5000C500335F95E3d0      ONLINE       0     0     0
c0t5000C500335F907Fd0      UNAVAIL      0     0     0
mirror-1                   ONLINE       0     0     0
c0t5000C500335BD117d0      ONLINE       0     0     0
c0t5000C500335DC60Fd0      ONLINE       0     0     0

device details:

c0t5000C500335F907Fd0    UNAVAIL          cannot open
status: ZFS detected errors on this device.
The device was missing.
see: http://support.oracle.com/msg/ZFS-8000-LR for recovery


errors: No known data errors

이 출력은 풀이 현재 상태인 이유에 대해 자세히 설명합니다. 여기에는 이해하기 쉬운 설명과 추가 정보를 얻을 수 있는 기술 자료 문서 링크가 포함됩니다. 기술 자료 문서는 현재 문제로부터 복구할 수 있는 가장 좋은 방법에 대한 최신 정보를 제공합니다. 자세한 구성 정보를 사용하면 어떤 장치가 손상되고 어떻게 풀을 복구할 수 있는지 확인할 수 있습니다.

위 예에서 UNAVAIL 장치는 교체해야 합니다. 장치가 교체된 후 필요에 따라 zpool online 명령을 사용하여 장치를 온라인으로 전환합니다. 예를 들면 다음과 같습니다.

# zpool online pond c0t5000C500335F907Fd0
warning: device 'c0t5000C500335DC60Fd0' onlined, but remains in degraded state
# zpool status -x
all pools are healthy

위 출력 결과에서는 리실버링이 완료될 때까지 장치가 성능 저하 상태로 유지됨을 알 수 있습니다.

autoreplace 등록 정보가 on인 경우에는 교체된 장치를 온라인으로 전환하지 않아도 될 수 있습니다.

풀에 오프라인 장치가 있을 경우 명령 출력 결과는 문제가 있는 풀을 나타냅니다. 예를 들면 다음과 같습니다.

# zpool status -x
pool: pond
state: DEGRADED
status: One or more devices has been taken offline by the administrator.
Sufficient replicas exist for the pool to continue functioning in a
degraded state.
action: Online the device using 'zpool online' or replace the device with
'zpool replace'.
config:

NAME                       STATE     READ WRITE CKSUM
pond                       DEGRADED     0     0     0
mirror-0                   DEGRADED     0     0     0
c0t5000C500335F95E3d0      ONLINE       0     0     0
c0t5000C500335F907Fd0      OFFLINE      0     0     0
mirror-1                   ONLINE       0     0     0
c0t5000C500335BD117d0      ONLINE       0     0     0
c0t5000C500335DC60Fd0      ONLINE       0     0     0

errors: No known data errors

READWRITE 열은 장치에서 발생한 I/O 오류 수를 제공하고, CKSUM 열은 장치에서 발생한 수정할 수 없는 체크섬 오류 수를 제공합니다. 두 오류 수는 모두 잠재적인 장치 실패를 나타내며, 일부는 수정 조치가 필요합니다. 최상위 레벨 가상 장치에 대해 0이 아닌 오류가 보고될 경우 데이터 중 일부에 액세스하지 못할 수 있습니다.

errors: 필드는 알려진 데이터 오류를 나타냅니다.

위의 예에 나온 출력 결과에서 오프라인 장치는 데이터 오류를 유발하지 않습니다.

UNAVAIL 상태의 풀 및 데이터 진단과 복구에 대한 자세한 내용은 Chapter 10, Oracle Solaris ZFS 문제 해결 및 풀 복구를 참조하십시오.

ZFS 저장소 풀 상태 정보 수집

zpool status 간격 및 수 옵션을 사용하여 기간에 따른 통계를 수집할 수 있습니다. 또한 –T 옵션을 사용하면 시간 기록을 표시할 수 있습니다. 예를 들면 다음과 같습니다.

# zpool status -T d 3 2
Wed Jun 20 16:10:09 MDT 2012
pool: pond
state: ONLINE
scan: resilvered 9.50K in 0h0m with 0 errors on Wed Jun 20 16:07:34 2012
config:

NAME                          STATE     READ  WRITE  CKSUM
pond                          ONLINE       0      0      0
   mirror-0                   ONLINE       0      0      0
      c0t5000C500335F95E3d0   ONLINE       0      0      0
      c0t5000C500335F907Fd0   ONLINE       0      0      0
   mirror-1                   ONLINE       0      0      0
      c0t5000C500335BD117d0   ONLINE       0      0      0
      c0t5000C500335DC60Fd0   ONLINE       0      0      0

errors: No known data errors

pool: rpool
state: ONLINE
scan: scrub repaired 0 in 0h11m with 0 errors on Wed Jun 20 15:08:23 2012
config:

NAME                         STATE     READ WRITE CKSUM
rpool                        ONLINE       0     0     0
mirror-0                     ONLINE       0     0     0
c0t5000C500335BA8C3d0s0      ONLINE       0     0     0
c0t5000C500335FC3E7d0s0      ONLINE       0     0     0

errors: No known data errors
Wed Jun 20 16:10:12 MDT 2012

pool: pond
state: ONLINE
scan: resilvered 9.50K in 0h0m with 0 errors on Wed Jun 20 16:07:34 2012
config:

NAME                       STATE     READ WRITE CKSUM
pond                       ONLINE       0     0     0
mirror-0                   ONLINE       0     0     0
c0t5000C500335F95E3d0      ONLINE       0     0     0
c0t5000C500335F907Fd0      ONLINE       0     0     0
mirror-1                   ONLINE       0     0     0
c0t5000C500335BD117d0      ONLINE       0     0     0
c0t5000C500335DC60Fd0      ONLINE       0     0     0

errors: No known data errors

pool: rpool
state: ONLINE
scan: scrub repaired 0 in 0h11m with 0 errors on Wed Jun 20 15:08:23 2012
config:

NAME                         STATE     READ WRITE CKSUM
rpool                        ONLINE       0     0     0
mirror-0                     ONLINE       0     0     0
c0t5000C500335BA8C3d0s0      ONLINE       0     0     0
c0t5000C500335FC3E7d0s0      ONLINE       0     0     0

errors: No known data errors