Sun Cluster 概念指南 (適用於 Solaris 作業系統)

Failfast 機制

如果 CMM 偵測到某節點發生緊急問題,則它會呼叫叢集框架以強制關閉 (當機) 節點,然後從叢集成員身份中移除該節點。 發生此情況的機制稱為 failfast。 Failfast 會導致節點以兩種方式關閉。

當叢集常駐程式的失效導致節點當機時,在該節點的主控台上會顯示類似下列內容的訊息。


panic[cpu0]/thread=40e60: Failfast: Aborting because "pmfd" died 35 seconds ago.
409b8 cl_runtime:__0FZsc_syslog_msg_log_no_argsPviTCPCcTB+48 (70f900, 30, 70df54, 407acc, 0)
%l0-7: 1006c80 000000a 000000a 10093bc 406d3c80 7110340 0000000 4001 fbf0

在當機之後,該節點可能重新啟動並嘗試重新連結叢集,或者停留在 OpenBootTM PROM (OBP) 提示符號處 (如果叢集由基於 SPARC 的系統組成)。 採用的動作由 auto-boot? 參數的設定所決定。 您可以在 OpenBoot PROM ok 提示符號處,使用 eeprom(1M) 來設定 auto-boot?