故障管理功能可以检测硬件和/或服务器模块(刀片)环境的以下故障:
cpu_heatsink_bl_sys_p
memory_dimm_ue_bl_sys_p_d
memory_dimm_ce_bl_sys_p_d
bios_no_memory_bl_sys
bios_keyboard_bl_sys
bios_video_bl_sys
bios_rom_corrupt_bl_sys
故障原因:
CPU 的温度达到或超过 82oC (179.6oF),并且
刀片的环境温度在可接受范围内(低于或等于 35oC (95oF)),并且
所有后部风扇模块运行正常。
针对故障可采取的措施:
刀片的“需要维修操作”LED 指示灯亮起。
机箱的“需要维修操作”LED 指示灯亮起。
更新 ILOM 管理界面以反映故障。
将故障记录到事件日志中。
刀片的 SP 尝试使刀片正常关闭。主机有两分钟的时间来执行正常关闭操作;两分钟后,SP 将强制执行立即关闭操作。
故障清除:
必须更换或修复刀片(更换出现故障的散热器)。
故障原因:
BIOS POST(或 Pc-Check)检测到 DIMM 上有不可纠正的 ECC 错误。
针对故障可采取的措施:
刀片的“需要维修操作”LED 指示灯亮起。
机箱的“需要维修操作”LED 指示灯亮起。
更新 ILOM 管理界面以反映故障。
将故障记录到事件日志中。
故障清除:
必须更换或修复刀片 (DIMM),或者操作员必须手动清除故障。
故障原因:
BIOS POST(或 Pc-Check)检测到 DIMM 上有可纠正的 ECC 错误。
针对故障可采取的措施:
刀片的“需要维修操作”LED 指示灯亮起。
机箱的“需要维修操作”LED 指示灯亮起。
更新 ILOM 管理界面以反映故障。
将故障记录到事件日志中。
故障清除:
必须更换或修复刀片 (DIMM),或者操作员必须手动清除故障。
故障原因:
BIOS POST 找不到此刀片主机的内存。
针对故障可采取的措施:
刀片的“需要维修操作”LED 指示灯亮起。
机箱的“需要维修操作”LED 指示灯亮起。
更新 ILOM 管理界面以反映故障。
将故障记录到事件日志中。
刀片主机不会引导。
故障清除:
必须更换或修复刀片,或者操作员必须手动清除故障。
故障原因:
BIOS POST 无法初始化键盘。
针对故障可采取的措施:
刀片的“需要维修操作”LED 指示灯亮起。
机箱的“需要维修操作”LED 指示灯亮起。
更新 ILOM 管理界面以反映故障。
将故障记录到事件日志中。
故障清除:
必须更换或修复刀片,或者操作员必须手动清除故障。
故障原因:
BIOS POST 找不到视频控制器。
针对故障可采取的措施:
刀片的“需要维修操作”LED 指示灯亮起。
机箱的“需要维修操作”LED 指示灯亮起。
更新 ILOM 管理界面以反映故障。
将故障记录到事件日志中。
刀片主机不会引导。
故障清除:
必须更换或修复刀片,或者操作员必须手动清除故障。