当特定保护组的主群集出现故障时,伙伴关系中的备用群集会检测到此故障。如果出现故障的群集是多个伙伴关系的成员,则可能会进行多次故障检测。
当保护组的整体状态变为 Unknown 状态时,系统将会执行以下操作:
伙伴群集检测到心跳故障。
以紧急模式激活心跳以验证心跳丢失是否不是瞬态以及主群集是否已出现故障。当心跳机制继续重试主群集时,心跳在此默认超时时间间隔内保持 OK 状态。只有心跳插件显示 Error 状态。
通过设置心跳的 Query_interval 属性来设置此查询时间间隔。如果心跳在经过四次尝试(由所配置的 Query_interval 决定,包括三次重试以及一次紧急模式探测)后仍然存在故障,系统将会生成 heartbeat-lost 事件,并在系统日志中记录此事件。指定默认时间间隔时,紧急模式的重试行为可能会使心跳丢失通知延迟大约九分钟。消息将显示在 GUI 中以及 geoadm status 命令的输出中。
有关日志记录的更多信息,请参见《Sun Cluster Geographic Edition 系统管理指南》中的“查看 Sun Cluster Geographic Edition 日志消息”。