如果故障指明为硬件故障,则推荐使用的清除故障的适当方法是更换故障组件。这样,可确保故障管理功能在故障清除后发出通知,还会使“需要维修操作”LED 指示灯熄灭并更新 ILOM 管理界面以反映已清除的故障。
对于大多数故障,您可以使用管理界面手动执行命令,来清除组件的故障状态。但是,如果执行了上述操作,而组件传感器判定故障状况仍然存在,则会立即再次声明故障。
确定发生硬件故障的系统组件。
查看“需要维修操作”LED 指示灯、组件状态(从 ILOM Web 界面或 CLI)和/或事件日志,以获得有关组件故障的信息。(请参见确定硬件是否发生了故障。)
移除并更换故障组件。
如有必要,请参阅故障组件的热插拔说明,以便正确而安全地移除和更换故障组件。
监视组件 LED 指示灯和/或管理界面,以确认故障管理功能已清除故障。
登录到 ILOM Web 界面。
选择 "System Information" 选项卡。
选择 "Components" 选项卡。
此时会出现 "Components" 页面,其中列出了 "Components Management Status" 表。
查找故障状态列为 Faulted 的组件。
请注意,如果存在故障组件,则机箱的故障状态也会列为 Faulted。
选择故障组件。
从 "Actions" 下拉框中选择 "Clear Fault"。
组件的故障状态将更新为 OK,其“需要维修操作”LED 指示灯将熄灭。但是,如果故障状况仍然存在,组件将几乎立即返回到故障状态,其“需要维修操作”LED 指示灯将重新亮起。
打开 ILOM CLI 窗口。
使用 cd
命令转到发生故障的组件。
使用 show
命令确认组件的 fault_state。
以下示例将检查后部风扇模块 0 (/CH/RFM0) 的状态,并显示其 fault_state 为 Faulted。
->cd /CH/RFM0
/CH/RFM0 ->show
/CH/RFM0 Targets: SERVICE ACT FAN1_OK FAN2_OK FAN1_SPEED FAN2_SPEED Properties: type = Rear Fan FRU fault_state = Faulted clear_fault_action = (none) prepare_to_remove_status = NotReady prepare_to_remove_action = (none) return_to_service_action = (none) ->
对故障组件执行 set clear_fault_action=true
命令。
以下命令会清除后部风扇模块 0 (/CH/RFM0) 的故障状态:
set /CH/RFM0 clear_fault_action=true
您可以再次使用 show
命令,来确认 fault_state 是否已更改为 OK。但是,如果故障状况仍然存在,组件将几乎立即返回到故障状态。