清除故障
清除故障的过程因具体的组件类型而有所不同。
表 3 组件类型和故障清除
|
|
可热交换且受 SP 监视的用户可更换单元 (Customer-replaceable unit, CRU) |
在更换出现故障的组件时自动清除故障且更新的状态报告为已取消断言。 |
具有带有标识信息的 FRUID 容器的 CRU 和现场可更换单元 (field-replaceable unit,
FRU) |
在更换出现故障的组件时自动清除故障。 |
不可热交换或缺少带有标识信息的 FRUID 容器的 CRU 和 FRU |
不会自动清除故障。 |
|
可以使用 Oracle ILOM Web 界面或命令行界面 (command-line interface, CLI) 手动清除故障。有关如何使用 Oracle ILOM Web
界面或 CLI 清除服务器故障的信息,请参见 Oracle ILOM 3.0 文档集。
以下故障类型由 SP 诊断。
表 4 组件故障类型
|
|
环境事件 |
风扇模块、电源、环境温度和 AC 功率损耗 |
内存引用代码 (Memory Reference Code, MRC) 错误和警告 |
内存初始化和填充 |
I/O 集线器
(I/O Hub, IOH) 不可更正的错误事件 |
主板 |
内存 ECC 不可更正和可更正的事件 |
内存 DIMM |
CPU 不可更正的错误事件 |
处理器 |
引导进度事件 |
通电、断电、IPMI、MRC、QPI、BIOS、设置和引导重试 |
服务处理器错误事件 |
Oracle ILOM |
|
该表列出了系统冷引导之后仍存在的服务器组件故障以及故障清除操作。
表 5 清除组件故障
|
|
DDR3 内存 DIMM |
更换时自动清除 |
CPU 模块 |
更换组件后手动清除故障 |
PCIe 卡 |
更换组件后手动清除故障 |
风扇模块 |
传感器状态为 "OK"(正常)时自动清除 |
电源 |
传感器状态为
"OK"(正常)时自动清除 |
磁盘驱动器 |
传感器状态为 "OK"(正常)时自动清除 |
|
另请参见