Solaris OS용 Sun Cluster 개요

오류 방지

클러스터에서 가장 중요한 문제는 클러스터를 분할하는 장애(정보 분리)입니다. 이러한 상황이 발생하면, 모든 노드가 통신할 수 있는 것은 아니므로 개인 노드나 노드 서브 세트가 개인 또는 서브 세트 클러스터를 형성할 수도 있습니다. 각 서브 세트 또는 분할 영역은 멀티 호스트 디스크에 대해 단 하나의 액세스 및 소유권을 갖고 있는 것으로 “인식”할 수도 있습니다. 여러 노드가 이 디스크에 쓰기를 시도하면 데이터 손상이 발생할 수 있습니다.

실패 방지는 디스크에 대한 액세스를 금지하여 멀티 호스트 디스크에 대한 노드 액세스를 제한합니다. 노드가 클러스터에서 나갈 경우(실패하거나 분할되어), 실패 방지는 그 노드가 더이상 디스크에 액세스할 수 없게 만듭니다. 현재 구성원 노드만 디스크에 대해 액세스할 수 있으므로, 데이터 무결성이 보장됩니다.

Sun Cluster 시스템은 SCSI 디스크 예약 기능을 사용하여 실패 방지를 구현합니다. SCSI 예약 기능을 사용하면 장애가 발생한 노드가 멀티 호스트 디스크로부터 “금지”되어 디스크에 액세스할 수 없습니다.

다른 노드가 더이상 클러스터 상호 연결을 통해 통신할 수 없음을 클러스터 구성원이 발견하면, 그 구성원은 실패 방지 절차를 시작하여 실패한 노드가 공유 디스크에 액세스하지 못하도록 합니다. 실패 방지가 발생하면 방지된 노드는 중단되고 “예약 충돌” 메시지가 콘솔에 나타납니다.