故障管理可以偵測伺服器模組 (刀鋒) 硬體和/或環境的下列錯誤:
cpu_heatsink_bl_sys_p
memory_dimm_ue_bl_sys_p_d
memory_dimm_ce_bl_sys_p_d
bios_no_memory_bl_sys
bios_keyboard_bl_sys
bios_video_bl_sys
bios_rom_corrupt_bl_sys
導致故障的原因:
CPU 的溫度已達到或超出 82oC (179.6oF)。
刀鋒的環境溫度在可接受的限制內 (小於或等於 35oC (95oF))。
所有後風扇模組都是正常運作中。
對故障產生的回應動作:
刀鋒之「需要維修操作」LED 會亮起。
機殼之「需要維修操作」LED 會亮起。
更新 ILOM 管理介面以反映故障。
故障會被記錄在事件記錄中。
刀鋒的 SP 會嘗試對刀鋒進行正常關機。主機在兩分鐘內可以進行正常關機;在兩分鐘後,SP 會強制立即關機。
清除故障:
必須更換或修復刀鋒 (更換失敗的散熱器)。
導致故障的原因:
DIMM 上的 BIOS POST (或 PC 檢查) 已發生不可更正的 ECC 錯誤。
對故障產生的回應動作:
刀鋒之「需要維修操作」LED 會亮起。
機殼之「需要維修操作」LED 會亮起。
更新 ILOM 管理介面以反映故障。
故障會被記錄在事件記錄中。
清除故障:
必須更換或修復刀鋒 (DIMM),或操作人員必須手動清除故障。
導致故障的原因:
DIMM 上的 BIOS POST (或 PC 檢查) 已發生可更正的 ECC 錯誤。
對故障產生的回應動作:
刀鋒之「需要維修操作」LED 會亮起。
機殼之「需要維修操作」LED 會亮起。
更新 ILOM 管理介面以反映故障。
故障會被記錄在事件記錄中。
清除故障:
必須更換或修復刀鋒 (DIMM),或操作人員必須手動清除故障。
導致故障的原因:
BIOS POST 找不到此刀鋒型主機的記憶體。
對故障產生的回應動作:
刀鋒之「需要維修操作」LED 會亮起。
機殼之「需要維修操作」LED 會亮起。
更新 ILOM 管理介面以反映故障。
故障會被記錄在事件記錄中。
刀鋒型主機將不會啟動。
清除故障:
必須更換或修復刀鋒,或操作人員必須手動清除故障。
導致故障的原因:
BIOS POST 無法初始化鍵盤。
對故障產生的回應動作:
刀鋒之「需要維修操作」LED 會亮起。
機殼之「需要維修操作」LED 會亮起。
更新 ILOM 管理介面以反映故障。
故障會被記錄在事件記錄中。
清除故障:
必須更換或修復刀鋒,或操作人員必須手動清除故障。
導致故障的原因:
BIOS POST 找不到視訊控制器。
對故障產生的回應動作:
刀鋒之「需要維修操作」LED 會亮起。
機殼之「需要維修操作」LED 會亮起。
更新 ILOM 管理介面以反映故障。
故障會被記錄在事件記錄中。
刀鋒型主機將不會啟動。
清除故障:
必須更換或修復刀鋒,或操作人員必須手動清除故障。