Oracle Solaris 11.2용 Oracle® Server Management Agent 사용 설명서

인쇄 보기 종료

업데이트 날짜: 2015년 6월
 
 

디스크 이벤트 모니터링

Oracle Solaris 11.2 SRU 10부터 Oracle Hardware Management Pack에는 개선된 진단 기능이 포함되어 있어서 독립적이든 아니면 RAID 볼륨에 있든지 간에 Sun Storage 6Gb SAS PCIe HBA, 내부(SGX-SAS6-INT-Z)에 연결된 디스크에서 디스크 오류 및 SMART 이벤트를 수집할 수 있습니다.

Hardware Management Agent가 실행 중일 경우 이러한 고급 진단 이벤트가 캡처되어 /var/log/ssm/event.log에 기록됩니다.

다음 표에는 기록되는 고급 진단 이벤트가 나열되어 있습니다.

로그의 이벤트 이름
설명
PD_RECOVERED_ERROR
디스크 복구 오류가 감지되었습니다.
PD_BAD_DEVICE_FAULT
명령 수행 중 복구할 수 없는 드라이브 오류가 장치에서 감지되었습니다.
PD_MEDIA_ERROR
복구할 수 없는 매체 오류가 장치에서 감지되었습니다.
PD_DEVICE_ERROR
복구할 수 없는 하드웨어 오류가 장치에서 감지되었습니다. 장치가 오프라인이거나 성능이 저하되었을 수 있습니다.
PD_TRANSPORT_ERROR
전송이 불안정하여 장치 경로가 구성되지 않았습니다.
PD_OVER_TEMPERATURE
디스크 SMART 프로세스가 중요한 온도를 보고합니다.
PD_SELF_TEST_FAILURE
디스크 SMART 자체 테스트가 한 개 이상 실패했습니다.
PD_PREDICTIVE_FAILURE
SMART 상태 모니터링 펌웨어가 디스크 오류 발생 가능성을 보고했습니다.

컨트롤러는 각 물리적 디스크를 정기적으로 폴링합니다. 디스크에서 오류가 발생한 경우 컨트롤러에서 이벤트를 생성합니다. Hardware Management Agent는 해당 이벤트를 캡처하여 하드웨어 관리 이벤트 로그에 입력합니다.

하드웨어 관리 이벤트 로그에서 이벤트 정보를 확인하려면 다음과 같이 입력하십시오.

# view /var/log/ssm/event.log

고급 진단 디스크 이벤트의 경우 다음과 유사한 정보가 표시됩니다.

Thu Apr 30 12:32:31 2015:(CLI) Event Name  : PD_MEDIA_ERROR
Thu Apr 30 12:32:31 2015:(CLI) Event Description : A medium error was 
detected by the device that was non-recoverable.
Thu Apr 30 12:32:31 2015:(CLI) ASC  : 0x10
Thu Apr 30 12:32:31 2015:(CLI) ASCQ : 0x3
Thu Apr 30 12:32:31 2015:(CLI) Sense Key : 0x3
Thu Apr 30 12:32:31 2015:(CLI) Source : LSI
Thu Apr 30 12:32:31 2015:(CLI) SAS Address : 0x5000cca01200fadd
Thu Apr 30 12:32:31 2015:(CLI) LSI Description : Unexpected sense: PD 
0c(e0xfc/s1) Path 5000cca01200fadd, CDB: 2f 00 00 fc 4d 42 00 10 00 00, 
Sense: 3/10/03
Thu Apr 30 12:32:31 2015:(CLI) Event TimeStamp : 04/30/2015 ; 19:30:25
Thu Apr 30 12:32:31 2015:(CLI) Node ID : 00000000:12
Thu Apr 30 12:32:31 2015:(CLI) Nac Name : /SYS/HDD1
Thu Apr 30 12:32:31 2015:(CLI) Serial Number : 001015N0JPXA   PMG0JPXA
Thu Apr 30 12:32:31 2015:(CLI) WWN No : PDS:5000cca01200fadd
Thu Apr 30 12:32:31 2015:(CLI) Disk Model : H106030SDSUN300G

그런 다음 이벤트 목록에 있는 정보를 사용하여 시스템에서 문제가 발생한 물리적 디스크를 확인할 수 있습니다. Oracle ILOM Nac 이름(시스템의 전면 패널에 있는 레이블과 일치함) 및 드라이브 일련 번호 등의 정보는 시스템에서 디스크 및 드라이브 슬롯을 식별하는 데 도움이 됩니다.


주 -  PD_OVER_TEMPERATURE, PD_SELF_TEST_FAILURE 및 PD_PREDICTIVE_FAILURE 이벤트의 경우 Oracle ILOM을 사용하여 사전 예방적 경보를 구성하십시오.

이 문서에 설명된 기타 디스크 진단 이벤트의 경우 디스크 문제가 의심될 때 관리자가 하드웨어 관리 이벤트 로그에서 이러한 디스크 이벤트가 있는지 확인해야 합니다. 현재는 이러한 이벤트를 사전에 알릴 수 있는 경보 방식이 없습니다.