清除故障

如果故障指明为硬件故障,则推荐使用的清除故障的适当方法是更换故障组件。这样,可确保故障管理功能在故障清除后发出通知,还会使“需要维修操作”LED 指示灯熄灭并更新 ILOM 管理界面以反映已清除的故障。

对于大多数故障,您可以使用管理界面手动执行命令,来清除组件的故障状态。但是,如果执行了上述操作,而组件传感器判定故障状况仍然存在,则会立即再次声明故障。

更换故障组件

  1. 确定发生硬件故障的系统组件。

    查看“需要维修操作”LED 指示灯、组件状态(从 ILOM Web 界面或 CLI)和/或事件日志,以获得有关组件故障的信息。(请参见确定硬件是否发生了故障。)

  2. 移除并更换故障组件。

    如有必要,请参阅故障组件的热插拔说明,以便正确而安全地移除和更换故障组件。

  3. 监视组件 LED 指示灯和/或管理界面,以确认故障管理功能已清除故障。

从 Web 界面清除故障

Caution

从 ILOM Web 界面手动清除故障状况后,并不能从根本上清除硬件故障。

  1. 登录到 ILOM Web 界面。

  2. 选择 "System Information" 选项卡。

  3. 选择 "Components" 选项卡。

    此时会出现 "Components" 页面,其中列出了 "Components Management Status" 表。

  4. 查找故障状态列为 Faulted 的组件。

    请注意,如果存在故障组件,则机箱的故障状态也会列为 Faulted

  5. 选择故障组件。

  6. 从 "Actions" 下拉框中选择 "Clear Fault"。

    组件的故障状态将更新为 OK,其“需要维修操作”LED 指示灯将熄灭。但是,如果故障状况仍然存在,组件将几乎立即返回到故障状态,其“需要维修操作”LED 指示灯将重新亮起。

从 CLI 清除故障

Caution

从 CLI 清除故障状况后,并不能从根本上清除硬件故障。

  1. 打开 ILOM CLI 窗口。

  2. 使用 cd 命令转到发生故障的组件。

  3. 使用 show 命令确认组件的 fault_state

    以下示例将检查后部风扇模块 0 (/CH/RFM0) 的状态,并显示其 fault_stateFaulted

    -> cd /CH/RFM0
    /CH/RFM0
    
    
    -> show
    
    
    /CH/RFM0
    Targets:
    	SERVICE
    	ACT
    	FAN1_OK
    	FAN2_OK
    	FAN1_SPEED
    	FAN2_SPEED
    
    
    Properties:
    	type = Rear Fan FRU
    	fault_state = Faulted 
    	clear_fault_action = (none)
    	prepare_to_remove_status = NotReady
    	prepare_to_remove_action = (none)
    	return_to_service_action = (none)
    
    
    ->
  4. 对故障组件执行 set clear_fault_action=true 命令。

    以下命令会清除后部风扇模块 0 (/CH/RFM0) 的故障状态:

    set /CH/RFM0 clear_fault_action=true

您可以再次使用 show 命令,来确认 fault_state 是否已更改为 OK。但是,如果故障状况仍然存在,组件将几乎立即返回到故障状态。