清除故障

當故障是硬體故障時,清除故障的適當和建議方法是更換失敗的元件。這可確保故障管理將會注意到故障已清除,並且將會熄滅「需要維修操作」LED 及更新 ILOM 管理介面,以反映已清除的故障。

對於大部分故障,您可以使用管理介面手動輸入指令,以清除元件的故障狀態。然而,如果您這樣做,當元件感應器判斷故障狀況仍存在時,隨即會再次宣告故障。

更換故障的元件

  1. 判斷已發生硬體故障的系統元件。

    查看「需要維修操作」LED、元件狀態 (從 ILOM Web 介面或 CLI),和/或事件記錄,以取得有關元件故障的資訊(請參閱判斷硬體是否發生故障。)

  2. 移除及更換失敗的元件。

    如果需要,請參閱有關失敗元件的熱插入指示,以便正確、安全地加以移除及更換。

  3. 監視元件 LED 和/或管理介面,確認故障管理已清除故障。

從 Web 介面清除故障

Caution

從 ILOM Web 介面手動清除故障狀況,不會更正根本的硬體故障。

  1. 登入 ILOM Web 介面。

  2. 選取 [System Information] 標籤。

  3. 選取 [Components] 標籤。

    這時會出現 [Components] 頁面,其中顯示 [Components Management Status] 表格。

  4. 尋找故障狀態列示成 [Faulted] 的元件。

    請注意,當有故障的元件時,機殼的故障狀態也會列示成 [Faulted]。

  5. 選取故障的元件。

  6. 從 [Actions] 下拉式方塊,選取 [Clear Fault]。

    元件的故障狀態將會更新成 [OK],且它的「需要維修操作」LED 將會熄滅。然而,如果故障狀態持續發生,元件將會立即回復至故障狀態,並且它的「需要維修操作」LED 將會重新亮起。

從 CLI 清除故障

Caution

從 CLI 清除故障狀況,不會更正根本的硬體故障。

  1. 開啟一個 ILOM CLI 視窗。

  2. 使用 cd 指令,移至已失敗的元件。

  3. 使用 show 指令,確認元件的 fault_state

    下列範例會檢查後風扇模組 0 (/CH/RFM0) 的狀態,並顯示其 fault_state = Faulted

    -> cd /CH/RFM0
    /CH/RFM0
    
    
    -> show
    
    
    /CH/RFM0
    Targets:
    	SERVICE
    	ACT
    	FAN1_OK
    	FAN2_OK
    	FAN1_SPEED
    	FAN2_SPEED
    
    
    Properties:
    	type = Rear Fan FRU
    	fault_state = Faulted 
    	clear_fault_action = (none)
    	prepare_to_remove_status = NotReady
    	prepare_to_remove_action = (none)
    	return_to_service_action = (none)
    
    
    ->
  4. 為故障的元件輸入 set clear_fault_action=true 指令。

    下列指令會清除後風扇模組 0 (/CH/RFM0) 的故障狀態:

    set /CH/RFM0 clear_fault_action=true

您可以再次使用 show 指令,確認 fault_state 已變更成 OK。然而,如果故障狀態持續存在,元件隨即會回復至故障狀態。