Sun Cluster 概述 (适用于 Solaris OS)

故障防护

群集的一个主要问题是引起群集分区的故障(称作记忆分裂)。当此故障发生时,并不是所有节点都可以通信,所以单个节点或节点子集可能会试图组成单独的群集或群集子集。每个子集或分区都可能“认为”它对多主机磁盘具有唯一访问权和所有权。多节点试图写入磁盘可能导致数据被破坏。

故障防护通过防止对磁盘的访问,限制了节点对多主机磁盘的访问。当节点脱离群集时(它或是发生故障,或是分区),故障防护确保了该节点不再能访问磁盘。只有当前成员节点有权访问磁盘,从而确保数据的完整性。

Sun Cluster 系统使用 SCSI 磁盘保留来实现故障防护。使用 SCSI 保留,故障节点就将与多主机磁盘“隔离”开来,使它们无法访问那些磁盘。

当群集成员检测到另一个节点不再通过群集互连进行通信时,它启动故障防护措施来避免这个出现故障的节点访问共享磁盘。当故障防护发生时,将停止使用被防护节点,并且其控制台上显示“保留冲突”消息。