Sun Cluster 簡介 (適用於 Solaris 作業系統)

故障隔離

叢集的主要問題是導致叢集被分割的故障 (稱為 Split Brain)。發生此情形時,不是所有的節點均可通訊,所以個別節點或節點子集可能會嘗試形成個別或子集叢集。每個子集或分割區可能「相信」自己擁有對多重主機磁碟的唯一存取權和所有權。多個節點嘗試寫入磁碟可能導致毀壞資料。

故障隔離藉由防止存取磁碟,來限制節點存取多重主機磁碟。當節點離開叢集時 (故障或被分割),故障隔離可確保節點不會再存取碟。僅目前的成員可以存取磁碟,因此確保了資料完整性。

Sun Cluster 系統使用 SCSI 磁碟保留來實現故障隔離。使用 SCSI 保留,便可以將故障節點與多重主機磁碟相「隔離」,防止它們存取這些磁碟。

當叢集成員偵測到另一個節點已經不再經由叢集互連進行通訊,即會啟動故障隔離程序來防止故障節點存取共用磁碟。發生故障隔離時,隔離的節點便會當機,並且其主控台上會顯示「保留衝突」訊息。