服务器组件出现故障时,服务器会生成特定于组件的故障,该故障可由节点的 ILOM 捕获。某些故障会在更换了可热维修的故障组件之后自动清除。针对不能热维修的组件生成的故障必须手动清除。可以使用 ILOM Web 界面或命令行界面 (command-line interface, CLI) 手动清除故障。
注 - 还可以使用服务器节点的 BIOS 设置实用程序来查看和删除系统事件日志。
对于 Sun Blade X6275 M2 服务器模块,以下类型的故障必须手动清除:
CPU 故障(在更换 CPU 之后)
DIMM 故障(在更换 DIMM 之后)
PCIe EM 故障(在更换 PCIe EM 之后)
主板故障(无论是否已更换主板)
ILOM 中的故障管理功能所捕获的其他故障包括由机箱监视模块 (Chassis Monitoring Module, CMM) 生成的故障。这些故障会在机箱中的其他组件出现故障时发生。机箱中的可热维修组件出现的故障会在维修操作完成之后自动清除。机箱中可热维修的组件出现的故障包括:
CMM 故障
风扇故障
电源故障
NEM 故障
系统不会自动清除与机箱相关的非热维修故障。您必须在 CMM ILOM 的故障管理功能中手动清除这些故障。在清除 CMM 报告的故障后,系统将在节点 ILOM 上的故障管理功能中自动清除与机箱相关的故障。
清除故障时,请注意以下事项:
要清除 DIMM、CPU、主板和 PCIe 故障,请访问服务器节点的 ILOM,并为发生故障的组件清除故障。
在清除内存 DIMM 的故障时,请注意,DIMM 故障可能发生在整个系统范围 (/SYS/MB),也可能发生在某一个 DIMM 上 (/SYS/MB/Pn/Dn)。
PCIe 故障包括 /SYS/MB/NETn。
有关如何使用 ILOM Web 界面或 CLI 清除服务器故障的信息,请参见 Oracle ILOM 3.0 文档集,网址为:http://docs.sun.com/app/docs/prod/int.lights.mgr30?l=zh
另请参见