Sun Blade 8000 Series의 고장 관리 소프트웨어는 하드웨어 상태를 모니터하고 시스템 구성 요소의 하드웨어 고장을 진단 및 보고합니다. 또한 고장 관리는 환경 조건을 모니터하고 시스템의 환경이 사용 가능한 매개 변수 범위를 벗어나면 보고합니다. 시스템 섀시의 다양한 센서, 전원 공급 장치(PSU), 서버 모듈(블레이드) 및 팬은 지속적으로 모니터되며 센서가 문제를 감지하면 섀시 모니터링 모듈(CMM)에서 실행되는 고장 관리 소프트웨어에 이를 알려 줍니다.
그러면 고장 관리가 문제를 진단합니다. 고장 관리 소프트웨어가 하드웨어 및 환경 관련 장애가 발생했다고 판단하면 영향을 받는 구성 요소의 서비스 작업 필요 LED를 켭니다. 또한 ILOM 관리 인터페이스가 업데이트되어 해당 장애(고장)를 반영하고 이 장애를 이벤트 로그에 고장으로 기록합니다.
Sun Blade 8000 Series의 고장 관리 소프트웨어는 Solaris의 고장 관리 아키텍처(FMA)와는 전혀 관계가 없습니다. 고장 관리는 시스템 관리 소프트웨어의 일부이며 블레이드 호스트 또는 해당 운영 체제와 상호 작용하지 않습니다.
시스템 구성 요소에서 하드웨어 고장이 발생하는 것을 내부 고장이라고 하며 이 고장은 Sun Blade 8000 Series 자체의 하드웨어 문제로 인한 것입니다. 내부 고장은 복구 조치가 취해지면 해결되며 대부분 고장난 구성 요소를 교체하게 됩니다.
몇 가지 외부 고장도 있습니다. 이 경우 고장난 시스템 하드웨어는 없지만 시스템 외부 조건으로 인해 잠재적인 문제를 일으키게 됩니다. 예를 들어, 섀시 외부의 주변 온도가 특정 임계값을 초과하면 이 문제가 해결되지 않는 경우 시스템 작동에 부정적인 영향을 주기 때문에 고장이 발생합니다. 외부 고장은 외부 조건이 해결되면 자동 해결됩니다. 그렇지만 주의하지 않으면 외부 고장으로 인해 구성 요소 또는 시스템이 전체적으로 중단될 수 있습니다.