Go to main content
Oracle® Linux Fault Management Architecture 소프트웨어 사용 설명서

인쇄 보기 종료

업데이트 날짜: 2015년 10월
 
 

고장 또는 결함 복구

Fault Management가 시스템에서 결함이 있는 구성 요소를 식별하면 해당 구성 요소를 복구해야 합니다. 복구는 두 가지 방법인 암시적 또는 명시적 방법 중 하나로 수행됩니다.

  • Fault Manager 데몬이 추적할 수 있는 일련 번호 정보가 구성 요소에 있는 경우 암시적 복구는 결함이 있는 구성 요소를 교체 또는 제거할 때 발생할 수 있습니다. 시스템의 일련 번호 정보가 포함되어 있으므로 Fault Manager 데몬은 교체 또는 다른 방법(예: 블랙리스트 작성)을 통해 구성 요소가 작동하지 않도록 제거된 시점을 확인할 수 있습니다. 이러한 감지가 수행된 경우 Fault Manager 데몬은 영향을 받은 리소스를 fmadm faulty 출력에 더 이상 표시하지 않습니다. 결함 이벤트가 30일이 지나서 제거될 때까지 리소스는 데몬의 내부 리소스 캐시에서 유지 관리됩니다.

  • FRU 일련 번호가 제공되지 않는 경우 명시적 복구가 필요합니다. 예를 들어 CPU의 경우 일련 번호가 없습니다. 이 경우 Fault Manager 데몬이 FRU 교체를 감지할 수 없습니다.

    결함이 복구된 것으로 명시적으로 표시하려면 fmadm 명령을 사용하십시오. 옵션은 다음과 같습니다.

    • fmadm replaced label

    • fmadm repaired label

    • fmadm acquit label

    • fmadm acquit uuid [label]

    이 네 개의 명령은 UUID 또는 레이블을 인수로 사용할 수 있지만 레이블을 사용하는 것이 더 좋습니다. 예를 들어, /SYS/MB/P0 레이블은 마더보드에 "P0" 레이블이 붙은 CPU를 나타냅니다.

    FRU에 여러 가지 결함이 있는 경우 FRU를 한 번만 교체하려면 FRU에 대해 fmadm replaced 명령을 사용하십시오.

fmadm replaced 명령

fmadm replaced 명령을 사용하여 의심스러운 FRU가 교체 또는 제거되었는지 확인할 수 있습니다.

시스템에서 FRU가 교체되었음(일련 번호가 변경됨)이 자동으로 검색되는 경우, 이러한 검색은 명령줄에 fmadm replaced를 입력한 것과 동일한 효과를 갖습니다. fmd를 통해 FRU가 교체되지 않았음(일련 번호가 변경되지 않음)을 자동으로 확인할 수 있는 경우 fmadm replaced 명령이 허용되지 않습니다.

시스템에서 FRU가 제거되었지만 교체되지 않았음이 자동으로 검색되면 현재 동작이 변경되지 않습니다. 즉, 의심 항목은 not present로 표시되지만 결함 이벤트가 30일이 지나서 제거될 때까지 영구적으로 제거된 것으로 간주되지 않습니다.

fmadm repaired 명령

문제를 해결하기 위해 FRU를 교체하는 대신에 일정한 물리적 복구를 수행한 경우 fmadm repaired 명령을 사용할 수 있습니다. 구성 요소를 다시 장착하거나 구부러진 핀을 펴는 것 등을 이러한 복구의 예로 들 수 있습니다.

fmadm acquit 명령

일반적으로 리소스가 원인이 아니었음이 확인된 경우에는 acquit 옵션이 자주 사용됩니다. 또한 추가 오류 이벤트가 발생하고 진단이 구체화되면 결함 해지가 암시적으로 수행될 수 있습니다.

교체는 복구보다 우선 순위가 높고 교체 및 복구는 결함 해지보다 우선 순위가 높습니다. 따라서 구성 요소를 결함 해지한 후 복구할 수 있지만 이미 복구된 구성 요소는 결함 해지할 수 없습니다.

해당 UUID가 결함 해지되거나 모든 의심 항목이 복구, 교체, 제거 또는 결함 해지된 경우 사례가 복구된 것으로 간주됩니다(FMD_CASE_REPAIRED 상태로 전환되고 list.repaired 이벤트가 생성됨).

일반적으로 fmd가 다중 요소 의심 목록에서 의심 항목을 자동으로 결함 해지하거나 지원 서비스가 제공하는 지침에 따라 결함 해지를 직접 수행합니다. 의심 항목이 존재하는 현재의 모든 사례에서 리소스가 원인이 아니라는 것을 확인한 경우에는 레이블별로 결함 해지해야 할 수 있습니다. 그러나 다음 옵션(UUID와 레이블을 둘 다 지정할 수 있음)을 사용하여 다른 모든 사례에서 의심 항목으로 유지하면서 한 사례에서만 FRU를 수동으로 결함 해지할 수 있습니다.

fmadm acquit uuid [label]