Sun Cluster 3.0 12/01 概念

故障快速防护机制

如果 CMM 检测到节点上存在严重的问题,它会要求群集框架来强制关闭该节点(应急状态)并将其从群集成员中删除。 实现这种功能的机制称为故障快速防护。 故障快速防护会使节点以两种方式关闭。

如果某个节点由于群集守护程序中止而进入应急状态,该节点的控制台上将显示类似以下内容的消息。


panic[cpu0]/thread=40e60: Failfast: Aborting because "pmfd" died 35 seconds ago.
409b8 cl_runtime:__0FZsc_syslog_msg_log_no_argsPviTCPCcTB+48 (70f900, 30, 70df54, 407acc, 0)
%l0-7: 1006c80 000000a 000000a 10093bc 406d3c80 7110340 0000000 4001 fbf0

进入应急状态之后,该节点可能重新引导,试图重新连接群集;也可能停留在 OpenBoot PROM (OBP) 提示符状态下。 执行的具体操作将由 OBP 中的 auto-boot? 参数的设置来决定。