Oracle® Solaris 11.2에서 결함 관리

인쇄 보기 종료

업데이트 날짜: 2014년 7월
 
 

고장 또는 결함 복구

특정 하드웨어 문제가 발생할 때 Oracle 서비스를 자동으로 요청하도록 Oracle ASR(자동 서비스 요청)을 구성할 수 있습니다. ASR에 대한 자세한 내용은 http://www.oracle.com/asr을 참조하십시오.

시스템의 구성 요소에 결함이 발생하면 결함 관리자가 해당 구성 요소를 암시적으로 복구하거나 사용자가 구성 요소를 명시적으로 복구할 수 있습니다.

암시적 복구

결함 관리자 데몬(fmd)이 추적할 수 있는 일련 번호 정보가 구성 요소에 포함된 경우 결함이 있는 구성 요소를 교체 또는 제거할 때 암시적 복구가 수행될 수 있습니다. 대부분의 SPARC 기반 시스템에는 일련 번호 정보가 FMRI에 포함되어 있으므로 fmd를 사용하면 교체 또는 다른 방법(예: 차단 목록 작성)을 통해 구성 요소가 작동하지 않도록 제거된 시점을 확인할 수 있습니다. fmd를 통해 구성 요소가 작동하지 않도록 제거된 것이 확인되면 결함 관리자가 해당 구성 요소를 더 이상 fmadm faulty 출력에 표시하지 않습니다. 이 구성 요소는 결함 이벤트가 30일이 지날 때까지 결함 관리자 내부 리소스 캐시에 유지 관리됩니다.

fmd로 결함이 있는 CPU 또는 메모리 리소스가 발견되면 해당 리소스가 차단 목록에 배치됩니다. 차단 목록에 있는 결함이 있는 리소스는 fmd가 해당 리소스를 복구 중인 것으로 표시할 때까지 다시 지정할 수 없습니다.

명시적 복구

일부 경우에는 FMRI에 섀시 식별자가 포함되었더라도 FRU 일련 번호 정보를 사용할 수 없습니다. 이 경우에는 fmd로 FRU 교체를 검색할 수 없고, 사용자가 다음 절에 표시된 것처럼 replaced, repaired 또는 acquit 하위 명령과 함께 fmadm 명령을 사용해서 명시적 복구를 수행해야 합니다. 명시적 복구는 문서화된 특정 복구 절차의 지침에 따라서만 수행해야 합니다.

이러한 fmadm 명령에는 다음과 같은 피연산자가 사용됩니다.

  • UUID(결함 관리자 출력에서 EVENT-ID로도 표시)는 결함 이벤트를 식별합니다. UUIDfmadm acquit 명령에서만 사용할 수 있습니다. 전체 이벤트를 안전하게 무시할 수 있도록 지정하거나 특정 리소스가 이 이벤트에서 의심 항목이 되지 않도록 지정할 수 있습니다.

  • FMRIlabel은 의심되는 결함이 있는 리소스를 식별합니다. 리소스의 FMRI 및 레이블 예는 Example 2–1에 나와 있습니다. 일반적으로는 FMRI보다 레이블을 사용하는 것이 더 쉽습니다.

결함 이벤트 UUID가 결함 해지되었거나 모든 의심되는 리소스가 복구, 교체, 이동 또는 결함 해지된 경우 사례가 복구된 것으로 간주됩니다. 복구된 사례는 FMD_CASE_REPAIRED 상태로 이동되고 결함 관리자가 list.repaired 이벤트를 생성합니다.