服务器模块(刀片)故障

故障管理功能可以检测硬件和/或服务器模块(刀片)环境的以下故障:

cpu_heatsink_bl_sys_p

  • 故障原因:

    • CPU 的温度达到或超过 82oC (179.6oF),并且

    • 刀片的环境温度在可接受范围内(低于或等于 35oC (95oF)),并且

    • 所有后部风扇模块运行正常。

  • 针对故障可采取的措施:

    • 刀片的“需要维修操作”LED 指示灯亮起。

    • 机箱的“需要维修操作”LED 指示灯亮起。

    • 更新 ILOM 管理界面以反映故障。

    • 将故障记录到事件日志中。

    • 刀片的 SP 尝试使刀片正常关闭。主机有两分钟的时间来执行正常关闭操作;两分钟后,SP 将强制执行立即关闭操作。

  • 故障清除:

    • 必须更换或修复刀片(更换出现故障的散热器)。

memory_dimm_ue_bl_sys_p_d

  • 故障原因:

    • BIOS POST(或 Pc-Check)检测到 DIMM 上有不可纠正的 ECC 错误。

  • 针对故障可采取的措施:

    • 刀片的“需要维修操作”LED 指示灯亮起。

    • 机箱的“需要维修操作”LED 指示灯亮起。

    • 更新 ILOM 管理界面以反映故障。

    • 将故障记录到事件日志中。

  • 故障清除:

    • 必须更换或修复刀片 (DIMM),或者操作员必须手动清除故障。

memory_dimm_ce_bl_sys_p_d

  • 故障原因:

    • BIOS POST(或 Pc-Check)检测到 DIMM 上有可纠正的 ECC 错误。

  • 针对故障可采取的措施:

    • 刀片的“需要维修操作”LED 指示灯亮起。

    • 机箱的“需要维修操作”LED 指示灯亮起。

    • 更新 ILOM 管理界面以反映故障。

    • 将故障记录到事件日志中。

  • 故障清除:

    • 必须更换或修复刀片 (DIMM),或者操作员必须手动清除故障。

bios_no_memory_bl_sys

  • 故障原因:

    • BIOS POST 找不到此刀片主机的内存。

  • 针对故障可采取的措施:

    • 刀片的“需要维修操作”LED 指示灯亮起。

    • 机箱的“需要维修操作”LED 指示灯亮起。

    • 更新 ILOM 管理界面以反映故障。

    • 将故障记录到事件日志中。

    • 刀片主机不会引导。

  • 故障清除:

    • 必须更换或修复刀片,或者操作员必须手动清除故障。

bios_keyboard_bl_sys

  • 故障原因:

    • BIOS POST 无法初始化键盘。

  • 针对故障可采取的措施:

    • 刀片的“需要维修操作”LED 指示灯亮起。

    • 机箱的“需要维修操作”LED 指示灯亮起。

    • 更新 ILOM 管理界面以反映故障。

    • 将故障记录到事件日志中。

  • 故障清除:

    • 必须更换或修复刀片,或者操作员必须手动清除故障。

bios_video_bl_sys

  • 故障原因:

    • BIOS POST 找不到视频控制器。

  • 针对故障可采取的措施:

    • 刀片的“需要维修操作”LED 指示灯亮起。

    • 机箱的“需要维修操作”LED 指示灯亮起。

    • 更新 ILOM 管理界面以反映故障。

    • 将故障记录到事件日志中。

    • 刀片主机不会引导。

  • 故障清除:

    • 必须更换或修复刀片,或者操作员必须手动清除故障。

bios_rom_corrupt_bl_sys

  • 故障原因:

    • BIOS POST 检测到固件 ROM 损坏。

  • 针对故障可采取的措施:

    • 刀片的“需要维修操作”LED 指示灯亮起。

    • 机箱的“需要维修操作”LED 指示灯亮起。

    • 更新 ILOM 管理界面以反映故障。

    • 将故障记录到事件日志中。

    • 刀片主机不会引导。

  • 故障清除:

    • 必须更换或修复刀片,或者操作员必须手动清除故障。