當故障是硬體故障時,清除故障的適當和建議方法是更換失敗的元件。這可確保故障管理將會注意到故障已清除,並且將會熄滅「需要維修操作」LED 及更新 ILOM 管理介面,以反映已清除的故障。
對於大部分故障,您可以使用管理介面手動輸入指令,以清除元件的故障狀態。然而,如果您這樣做,當元件感應器判斷故障狀況仍存在時,隨即會再次宣告故障。
判斷已發生硬體故障的系統元件。
查看「需要維修操作」LED、元件狀態 (從 ILOM Web 介面或 CLI),和/或事件記錄,以取得有關元件故障的資訊(請參閱判斷硬體是否發生故障。)
移除及更換失敗的元件。
如果需要,請參閱有關失敗元件的熱插入指示,以便正確、安全地加以移除及更換。
監視元件 LED 和/或管理介面,確認故障管理已清除故障。
登入 ILOM Web 介面。
選取 [System Information] 標籤。
選取 [Components] 標籤。
這時會出現 [Components] 頁面,其中顯示 [Components Management Status] 表格。
尋找故障狀態列示成 [Faulted] 的元件。
請注意,當有故障的元件時,機殼的故障狀態也會列示成 [Faulted]。
選取故障的元件。
從 [Actions] 下拉式方塊,選取 [Clear Fault]。
元件的故障狀態將會更新成 [OK],且它的「需要維修操作」LED 將會熄滅。然而,如果故障狀態持續發生,元件將會立即回復至故障狀態,並且它的「需要維修操作」LED 將會重新亮起。
開啟一個 ILOM CLI 視窗。
使用 cd
指令,移至已失敗的元件。
使用 show
指令,確認元件的 fault_state。
下列範例會檢查後風扇模組 0 (/CH/RFM0) 的狀態,並顯示其 fault_state = Faulted。
->cd /CH/RFM0
/CH/RFM0 ->show
/CH/RFM0 Targets: SERVICE ACT FAN1_OK FAN2_OK FAN1_SPEED FAN2_SPEED Properties: type = Rear Fan FRU fault_state = Faulted clear_fault_action = (none) prepare_to_remove_status = NotReady prepare_to_remove_action = (none) return_to_service_action = (none) ->
為故障的元件輸入 set clear_fault_action=true
指令。
下列指令會清除後風扇模組 0 (/CH/RFM0) 的故障狀態:
set /CH/RFM0 clear_fault_action=true
您可以再次使用 show
指令,確認 fault_state 已變更成 OK。然而,如果故障狀態持續存在,元件隨即會回復至故障狀態。