MegaRAID 디스크 컨트롤러를 사용하는 Oracle x86 서버에서는 SAS(직렬 연결 SCSI) 데이터 경로 오류가 발생할 수 있습니다. SAS 디스크 컨트롤러, DBP(디스크 백플레인), SAS 케이블, SAS 확장기 또는 HDD(하드 디스크 드라이브)에서 데이터 경로 문제를 분류하여 격리하려면 디스크 컨트롤러 이벤트 로그에서 이벤트를 수집하여 검토합니다. 서버 SAS 토폴로지를 기반으로 디스크 컨트롤러가 보고한 모든 오류 이벤트를 분류 및 분석합니다.
MegaRAID 디스크 컨트롤러 이벤트를 분류하려면 다음과 같이 하십시오.
자동 sundiag 유틸리티를 실행하거나 MegaCLI 또는 StorCLI 명령을 수동으로 사용하여 MegaRAID 디스크 컨트롤러 이벤트 로그를 수집한 후 구문 분석합니다.
Oracle Exadata Database Machine 데이터베이스 또는 스토리지 셀 서버의 경우 sundiag 유틸리티를 실행합니다.
Sun Server X3-2의 경우 MegaCLI 명령을 사용합니다.
예를 들어, MegaCLI 명령을 사용하여 수동으로 컨트롤러 이벤트 로그를 수집하고 구문을 분석합니다. 루트 프롬프트에 다음을 입력하십시오.
root# ./MegaCli64 adpeventlog getevents –f event.log aall Success in AdpEventLogExit Code: 0x00
SAS 데이터 경로 오류의 이벤트 로그에서 발견된 다음과 같은 SCSI 감지 키 오류는 SAS 데이터 경로 결함을 나타냅니다.
B/4B/05 :SERIOUS: DATA OFFSET ERROR B/4B/03 :SERIOUS: ACK/NAK TIMEOUT B/47/01 :SERIOUS: DATA PHASE CRC ERROR DETECTED B/4B/00 :SERIOUS: DATA PHASE ERROR
디스크와 호스트 버스 어댑터 간의 통신 결함으로 인해 이러한 오류가 발생합니다. 이러한 오류가 발생하면 단일 디스크인 경우에도 데이터 경로 문제가 있음을 의미합니다. RAID 컨트롤러, SAS 케이블, SAS 확장기 또는 디스크 백플레인이 RAID 컨트롤러와 디스크 간 경로에서 통신 중단을 일으킬 수 있습니다.
오라클 서비스 담당자는 My Oracle Support 웹 사이트(https://support.oracle.com)에서 x86 서버의 하드 디스크와 SAS 데이터 경로 오류에 대한 진단 및 분류와 관련된 자세한 내용을 찾을 수 있습니다. 기술 자료 문서의 문서 ID 2161195.1을 참조하십시오. Exadata 서버에 동시 디스크 문제가 여러 개 발생하는 경우 오라클 서비스 담당자는 지식 문서의 문서 ID 1370640.1을 참조할 수 있습니다.