Sun Cluster 3.0 12/01 概念

Failfast 機制

如果 CCM 偵測到節點的嚴重問題,它會呼叫叢集框架強制關掉 (混亂的) 節點,並將其從叢集成員中移除。 發生此情況的機制稱為 failfast。Failfast 會導致節點以兩種方式關閉。

當由於叢集常駐程式掛掉而產生混亂時,類似下列訊息會顯示在該節點的主控台上。


panic[cpu0]/thread=40e60: Failfast: Aborting because "pmfd" died 35 seconds ago.
(由於「pmfd」在 35 秒之前掛掉而中斷。)
409b8 cl_runtime:__0FZsc_syslog_msg_log_no_argsPviTCPCcTB+48 (70f900, 30, 70df54, 407acc, 0)
%l0-7:1006c80 000000a 000000a 10093bc 406d3c80 7110340 0000000 4001 fbf0 

混亂過後,節點可能重新啟動並嘗試重新連接叢集,或停留於 OpenBoot PROM (OBP) 提示處。 所採取的行動取決於 OBP 中 auto-boot? 參數的設定。