Sun Cluster 3.0 개념

고가용성 프레임워크

Sun Cluster는 네트워크 인터페이스를 포함하여 사용자들 및 데이터 고가용성, 자체 응용프로그램, 파일 시스템 그리고 멀티호스트 디스크들 사이의 "경로"에 모든 구성요소를 만듭니다. 일반적으로, 클러스터 구성요소는 시스템에서 단일(소프트웨어 또는 하드웨어) 실패를 극복할 경우, 가용성이 높습니다.

다음 테이블은 Sun Cluster 구성요소 실패의 종류(하드웨어 및 소프트웨어 모두)와 고가용성 프레임워크에 형성된 복구 종류를 보여줍니다.

표 3-1 Sun Cluster 실패 감지 및 복구 레벨

실패한 클러스터 자원 

소프트웨어 복구 

하드웨어 복구 

데이터 서비스 

HA API, HA 프레임워크 

N/A 

공용 네트워크 어댑터 

네트워크 어댑터 페일오버(NAFO) 

다중 공용 네트워크 어댑터 카드 

클러스터 파일 시스템 

1차 및 2차 복제본 

멀티호스트 디스크 

미러링된 멀티호스트 디스크 

볼륨 관리(Solstice DiskSuite 및 VERITAS Volume Manager) 

하드웨어 RAID-5(예: Sun StorEdge A3x00) 

글로벌 디바이스 

1차 및 2차 복제본 

디바이스, 클러스터 전송 접합에 대한 다중 경로 

사설 네트워크 

HA 전송 소프트웨어 

여러 개인용 하드웨어 독립 네트워크 

노드 

CMM, 페일페스트(failfast) 드라이버 

다중 노드 

Sun Cluster 고가용성 프레임워크는 노드 실패를 재빨리 감지하여 클러스터의 나머지 노드에서 프레임워크 자원에 대한 새로운 동등한 서버를 작성합니다 언제나 모든 프레임워크 자원이 사용 가능합니다. 훼손된 노드의 영향을 받지 않는 프레임워크 자원은 복구 동안 완전히 사용할 수 있게 됩니다. 또한 실패한 노드의 프레임워크 자원은 복구되는 대로 사용할 수 있게 됩니다. 복구된 프레임워크 자원은 다른 모든 프레임워크 자원이 복구를 완료할 때까지 기다리지 않아도 됩니다.

대부분의 고가용성 프레임워크 자원은 복구될 때 이 자원을 사용하는 응용프로그램(데이터 서비스)에 투명하게 복구됩니다. 프레임워크 자원 액세스의 시멘틱은 노드 실패에서 완전하게 보존됩니다. 응용프로그램은 프레임워크 자원 서버가 다른 노드로 이동되었다는 것을 간단하게 알릴 수 없습니다. 단일 노드의 실패는 대체 하드웨어 경로가 다른 노드의 디스크에 대해 존재한다면, 이 노드에 접속된 파일, 디바이스 및 디스크 볼륨을 사용하는 나머지 노드에 있는 프로그램에 완전하게 나타납니다. 예를 들어, 여러 노드에 대한 포트를 갖고 있는 멀티호스트 디스크를 사용할 경우가 있습니다.

클러스터 멤버쉽 모니터

CMM(Cluster Membership Monitor)은 클러스터 구성원당 하나씩 분산된 에이전트 세트입니다. 에이전트들은 클러스터 상호연결을 거쳐 메시지를 교환하여 다음을 수행합니다.

이전 Sun Cluster 릴리스와는 달리, CMM은 커널에서 전체적으로 실행됩니다.

클러스터 멤버쉽

CMM의 주요 기능은 주어진 시간에 클러스터에 참여하는 노드 세트에서 클러스터 전반에 대한 일치를 확립하는 것입니다. Sun Cluster는 이러한 제한사항을 클러스터 멤버쉽이라고 합니다.

클러스터 멤버쉽을 판별하고, 궁극적으로 데이터 무결성을 보장하기 위해 CMM은 다음을 수행합니다.

클러스터가 별도의 여러 클러스터로 스스로를 파티션하지 않도록 보호하는 방법에 대해서는 "정족수 및 정족수 디바이스"의 내용을 참조하십시오.

클러스터 멤버쉽 모니터 재구성

데이터를 훼손하지 않고 안전하게 보존하려면, 모든 노드가 클러스터 멤버쉽에서 일관되게 일치해야 합니다. 필요할 경우, CMM은 실패에 대한 응답에서 클러스터 서비스(응용프로그램)의 클러스터 재구성에 통합됩니다.

CMM은 클러스터 전송 계층으로부터 다른 노드에 대한 연결 정보를 수신합니다. CMM은 클러스터 상호연결을 사용하여 재구성 동안의 상태 정보를 교환합니다.

클러스터 멤버쉽에서의 변경을 발견하면, CMM은 클러스터의 동기화된 구성을 수행하며, 이 때 클러스터 자원은 클러스터의 새로운 멤버쉽을 기초로 재분배될 수 있습니다.

클러스터 구성 저장소(CCR)

CCR(Cluster Configuration Repository)은 클러스터의 구성 및 상태에 대한 정보를 저장하기 위한 클러스터 전반의 개인용 데이터베이스입니다. CCR은 분배 데이터베이스입니다. 각 노드는 데이터베이스의 전체 사본을 관리합니다. CCR은 모든 노드가 클러스터 "전체"의 일관된 보기를 수반하도록 합니다.

CCR은 고가용성 서비스로서 커널에서 구현됩니다.

CCR은 갱신사항에 대해 2단계 확약 알고리즘을 사용합니다. 갱신사항은 모든 클러스터 구성원에 대해 성공적으로 적용되거나 그렇지 않을 경우 롤백되어야 합니다. CCR은 클러스터 상호연결을 사용하여 분배된 갱신사항을 적용합니다.


주의 - 주의 -

CCR이 텍스트 파일로 구성되어도, 수동으로 CCR 파일들을 편집하지 마십시오. 각 파일에는 일관성이 유지되도록 체크섬 레코드가 포함됩니다. 수동으로 CCR 파일을 갱신하면 노드나 전체 클러스터가 기능 수행을 정지시킬 수 있습니다.


CCR은 정족수가 확립될 때만 클러스터가 실행되도록 하기 위해 CMM에 의존합니다. CCR은 클러스터에서 데이터 일관성을 확인해야 하는 책임을 갖고 있으므로 필요에 따라 복구를 수행하고 데이터를 갱신합니다.