Solaris OS용 Sun Cluster 개념 안내서

4장 FAQ

이 장은 Sun Cluster 시스템에 대하여 자주 문의하는 사항에 대한 응답으로 구성되어 있습니다. 응답은 주제별로 조직되어 있습니다.

고가용성 FAQ

질문:

고가용성 시스템이란 정확히 무엇입니까?

응답:

Sun Cluster 시스템에서는 클러스터에서 응용 프로그램을 계속 실행하는 기능을 고가용성(HA)이라고 정의합니다. 장애가 발생하여 서버 시스템을 정상적으로 사용할 수 없을 때에도 응용 프로그램은 실행됩니다.

질문:

클러스터는 어떤 프로세스를 통해 높은 가용성을 제공합니까?

응답:

클러스터 프레임워크는 페일오버라고 하는 프로세스를 통해 고가용성 환경을 제공합니다. 페일오버는 장애가 발생한 노드로부터 작동 중인 다른 노드로 데이터 서비스 자원을 전환하기 위해 클러스터에서 수행하는 일련의 단계입니다.

질문:

HA와 확장 가능 서비스간의 차이점은 무엇입니까?

응답:

고가용성 데이터 서비스에는 두 가지 유형이 있습니다.

페일오버 데이터 서비스는 클러스터에서 한 번에 하나의 기본 노드에서만 응용 프로그램을 실행합니다. 다른 노드에서는 다른 응용 프로그램을 실행할 수 있지만, 각 응용 프로그램이 하나의 노드에서만 실행됩니다. 기본 노드에 장애가 발생하면 이 노드에서 실행 중인 응용 프로그램은 다른 노드로 페일오버되어 계속 실행됩니다.

확장 가능 서비스는 하나의 응용 프로그램을 여러 노드에 분산시켜서 하나의 논리 서비스를 작성합니다. 확장 가능 서비스는 실행되는 전체 클러스터에서 여러 노드와 프로세스를 조정합니다.

응용 프로그램마다 하나의 노드가 클러스터에 대한 물리적 인터페이스를 호스트합니다. 이러한 노드를 GIF(Global Interface) 노드라고 합니다. 여러 개의 GIF 노드가 클러스터에 존재할 수 있습니다. 각 GIF 노드는 확장 가능한 서비스에서 사용할 수 있는 하나 이상의 논리 인터페이스를 호스트합니다. 이러한 논리 인터페이스를 전역 인터페이스라고 합니다. 하나의 GIF 노드가 전역 인터페이스를 호스트하여 특정 응용 프로그램에 대한 모든 요청을 받고 Application Server를 실행하는 여러 노드로 이 요청을 전달합니다. GIF 노드에 장애가 발생하면 전역 인터페이스가 남아있는 노드로 페일오버합니다.

응용 프로그램을 실행 중인 노드에 장애가 발생하면 해당 응용 프로그램은 다른 노드에서 계속 실행되지만 성능은 다소 저하됩니다. 이 프로세스는 장애가 발생한 노드가 클러스터에 돌아갈 때까지 계속됩니다.

파일 시스템 FAQ

질문:

하나 이상의 클러스터 노드를 고가용성 NFS 서버로 실행하고 다른 클러스터 노드는 클라이언트로 실행할 수 있습니까?

응답:

안됩니다. 루프백 마운트를 하면 안됩니다.

질문:

Resource Group Manager의 제어를 받지 않는 응용 프로그램에 클러스터 파일 시스템을 사용할 수 있습니까?

응답:

예. 그러나 RGM의 제어가 없으면 응용 프로그램을 실행하고 있는 노드에 장애가 발생하면 직접 해당 응용 프로그램을 다시 시작해야 합니다.

질문:

모든 클러스터 파일 시스템의 /global 디렉토리에 마운트 지점이 있어야 합니까?

응답:

아닙니다. 그러나 /global과 같이 동일한 마운트 지점에 클러스터 파일 시스템을 두면 이러한 파일 시스템을 쉽게 구성하고 관리할 수 있습니다.

질문:

클러스터 파일 시스템을 사용하는 것과 NFS 파일 시스템을 내보내는 것이 어떤 차이가 있습니까?

응답:

여러 가지 차이점이 있습니다.

  1. 클러스터 파일 시스템은 전역 장치를 지원합니다. NFS는 장치에 대한 원격 액세스를 지원하지 않습니다.

  2. 클러스터 파일 시스템에는 전역 이름 공간이 있습니다. 하나의 마운트 명령만 필요합니다. NFS를 사용할 경우, 각 노드에서 파일 시스템을 마운트해야 합니다.

  3. 클러스터 파일 시스템은 NFS를 수행하는 경우보다 많이 파일을 캐시합니다. 예를 들어 클러스터 파일 시스템은 읽기, 쓰기, 파일 잠금, 비동기 I/O를 위해 여러 노드에서 파일에 액세스할 때 파일을 캐시합니다.

  4. 클러스터 파일 시스템은 향후에 원격 DMA 및 zero-copy 기능을 제공하는 고속 클러스터 상호 연결을 구축할 수 있도록 설계되었습니다.

  5. 클러스터 파일 시스템에서 파일에 대한 등록 정보를 변경하면(예를 들어, chmod(1M) 명령 사용), 변경한 내용이 모든 노드에 즉시 적용됩니다. 내보낸 NFS 파일 시스템에서는 이 변경 내용을 적용하는 데 시간이 더 오래 걸릴 수 있습니다.

질문:

파일 시스템 /global/.devices/node@nodeID가 사용자의 클러스터 노드에 표시됩니다. 이 파일 시스템을 사용하여 가용성이 높은 전역 데이터를 저장할 수 있습니까?

응답:

이 파일 시스템은 전역 장치 이름 공간을 저장합니다. 이 파일 시스템은 일반적인 용도로 사용되지 않습니다. 이 파일 시스템은 전역이지만 전역 방식으로는 액세스할 수 없습니다. 각 노드는 자체 전역 장치 이름 공간만 액세스합니다. 노드가 중단되면 다른 노드가 중단된 노드에 대한 이름 공간에 액세스할 수 있습니다. 이 파일 시스템은 가용성이 높지 않습니다. 전역 방식으로 액세스하거나 가용성이 높아야 하는 데이터를 저장할 경우에는 이 파일 시스템을 사용하면 안됩니다.

볼륨 관리 FAQ

질문:

모든 디스크 장치를 미러해야 합니까?

응답:

고가용성으로 간주되는 디스크 장치의 경우에는 미러해야 합니다. 그렇지 않으면, RAID-5 하드웨어를 사용하십시오. 모든 데이터 서비스는 고가용성 디스크 장치나 고가용성 디스크 장치에 마운트된 클러스터 파일 시스템을 사용해야 합니다. 이렇게 구성하면 하나의 디스크에 장애가 발생할 경우에도 안전합니다.

질문:

로컬 디스크(부트 디스크)에 하나의 볼륨 관리자를 사용하고 멀티 호스트 디스크에 다른 볼륨 관리자를 사용할 수 있습니까?

응답:

SPARC: 이 구성은 로컬 디스크를 관리하는 Solaris 볼륨 관리자 소프트웨어와 멀티 호스트 디스크를 관리하는 VERITAS Volume Manager에서 지원합니다. 다른 조합은 지원되지 않습니다.

x86: 아니요, 이 구성은 지원되지 않습니다. x86 기반 클러스터에서는 Solaris 볼륨 관리자만 지원됩니다.

데이터 서비스 FAQ

질문:

어떤 Sun Cluster 데이터 서비스를 사용할 수 있습니까?

응답:

지원되는 데이터 서비스 목록은 Solaris OS용 Sun Cluster 3.1 8/05 릴리스 노트지원 제품에 있습니다.

질문:

Sun Cluster 데이터 서비스에서 어떤 응용 프로그램 버전이 지원됩니까?

응답:

지원되는 응용 프로그램 버전 목록은 Solaris OS용 Sun Cluster 3.1 8/05 릴리스 노트지원 제품에 있습니다.

질문:

자체 데이터 서비스를 작성할 수 있습니까?

응답:

예. 자세한 내용은 Solaris OS용 Sun Cluster 데이터 서비스 개발 안내서의 11 장, DSDL API 함수를 참조하십시오.

질문:

네트워크 자원을 제공할 때 숫자 IP 주소나 호스트 이름을 지정해야 합니까?

응답:

네트워크 자원을 지정하는 데는 숫자 IP 주소를 사용하는 것보다 UNIX 호스트 이름을 사용하는 것이 좋습니다.

질문:

네트워크 자원을 제공할 때 논리 호스트 이름(LogicalHostname 자원)을 사용하는 것과 공유 주소(SharedAddress 자원)를 사용하는 것이 어떤 차이가 있습니까?

응답:

Sun Cluster HA for NFS의 경우를 제외하고, 설명서에서 페일오버 모드 자원 그룹의 LogicalHostname 자원을 사용할 것을 권장하는 모든 경우 SharedAddress 자원 또는 LogicalHostname 자원을 혼용하여 사용할 수 있습니다. SharedAddress 자원을 사용하면 약간의 추가 오버헤드가 발생합니다. 클러스터 네트워킹 소프트웨어가 SharedAddress에 대해서는 구성되지만 LogicalHostname에 대해서는 구성되지 않기 때문입니다.

확장 가능 및 페일오버 데이터 서비스를 모두 구성하여 클라이언트에서 동일한 호스트 이름을 사용하여 두 서비스에 모두 액세스할 수 있게 하려면 SharedAddress 자원을 사용하는 것이 좋습니다. 이 경우 SharedAddress 자원은 페일오버 응용 프로그램 자원과 함께 한 개의 자원 그룹에 포함됩니다. 확장 가능 서비스 자원은 별도의 자원 그룹에 포함되어 SharedAddress 자원을 사용하도록 구성됩니다. 이렇게 하면 확장 가능 서비스와 페일오버 서비스에서 모두 SharedAddress 자원에 구성된 동일한 호스트 이름/주소 집합을 사용할 수 있습니다.

공용 네트워크 FAQ

질문:

어떤 공용 네트워크 어댑터가 Sun Cluster 시스템을 지원합니까?

응답:

현재 Sun Cluster 시스템이 이더넷(10/100BASE-T 및 1000BASE-SX Gb) 공용 네트워크 어댑터를 지원합니다. 이후에 새로운 인터페이스가 지원될 수 있으므로 최신 정보는 Sun 영업 담당자에게 문의하십시오.

질문:

페일오버에서 MAC 주소의 역할은 무엇입니까?

응답:

페일오버가 발생할 경우, 새로운 ARP (Address Resolution Protocol) 패킷이 생성되어 전체에 브로드캐스팅됩니다. 이러한 ARP 패킷에는 새로운 MAC 주소(노드가 페일오버한 새로운 물리적 어댑터와 이전 IP 주소가 있습니다. 네트워크의 다른 시스템이 패킷 중 하나를 수신할 경우 그 시스템은 해당 ARP 캐시에서 이전 MAC-IP 매핑을 지우고 새 매핑 정보를 사용합니다.

질문:

Sun Cluster 시스템이 local-mac-address?=true 설정을 지원합니까?

응답:

예. 실제로 IP Network Multipathing에서는 local-mac-address? true로 설정되어야 합니다.

SPARC 기반 클러스터의 OpenBoot PROM ok 프롬프트에서 eeprom(1M)을 사용하여 local-mac-address?를 설정할 수 있습니다. MAC 주소는 x86 기반 클러스터에서 BIOS를 부트한 후에 선택적으로 실행하는 SCSI 유틸리티를 사용하여 설정할 수도 있습니다.

질문:

IP (Internet Protocol) Network Multipathing에서 어댑터 간에 스위치오버를 수행하면 어느 정도 지연될 수 있습니까?

응답:

몇 분 동안 지연될 수 있습니다. IP (Internet Protocol) Network Multipathing 스위치오버를 수행할 때 Gratuitous ARP를 전송하기 때문입니다. 그러나 클라이언트와 클러스터를 연결하는 라우터에서 Gratuitous ARP를 사용할 지는 확실하지 않습니다. 따라서 라우터에서 이 IP 주소에 대한 ARP 캐시 항목의 시간이 만료될 때까지 이 항목은 오래된 MAC 주소를 사용할 수 있습니다.

질문:

네트워크 어댑터 오류가 얼마나 빨리 감지됩니까?

응답:

기본 장애 감지 시간은 10초입니다. 알고리즘에서 장애 감지 시간을 맞추려 하지만 실제 시간은 네트워크 로드에 따라 달라집니다.

클러스터 구성원 FAQ

질문:

모든 클러스터 구성원이 동일한 루트 암호를 사용해야 합니까?

응답:

각 클러스터 구성원에서 동일한 루트 암호를 가질 필요는 없습니다. 그러나 모든 노드에서 동일한 루트 암호를 사용하면 쉽게 클러스터를 관리할 수 있습니다.

질문:

노드의 부트 순서가 중요합니까?

응답:

대부분의 경우 그렇지 않습니다. 그러나 정보 유실을 막으려면 부트 순서가 중요합니다. 예를 들어, 노드 2가 쿼럼 장치를 소유하고 있을 때 노드 1이 중단된 상태에서 사용자가 노드 2를 중단시키면 노드 1을 다시 실행하기 전에 노드 2를 먼저 실행해야 합니다. 이 순서대로 실행하면 오래된 클러스터 구성 정보를 가진 노드를 실수로 사용하지 않도록 방지할 수 있습니다. 정보 유실에 대한 자세한 내용은 장애 차단 정보를 참조하십시오.

질문:

클러스터 노드에서 로컬 디스크를 미러해야 합니까?

응답:

예. 이 미러링이 요구 사항은 아니지만 클러스터 노드의 디스크를 미러링하면 미러되지 않은 디스크 장애로 인해 노드가 중단되는 것을 방지할 수 있습니다. 클러스터 노드의 로컬 디스크를 미러하면 시스템 관리에 오버헤드가 부가됩니다.

질문:

클러스터 구성원을 백업하는 데는 어떤 문제가 있습니까?

응답:

하나의 클러스터에 대해 여러 가지 백업 방법을 사용할 수 있습니다. 한 가지 방법은 한 개의 노드를 테이프 드라이브나 라이브러리가 연결된 백업 노드로 사용하는 것입니다. 그리고 나서, 데이터를 백업하기 위해 클러스터 파일 시스템을 사용합니다. 이 노드를 공유 디스크에 연결하지는 마십시오.

데이터를 백업 및 복원하는 방법에 대한 추가 정보는 Solaris OS용 Sun Cluster 시스템 관리 안내서의 9 장, 클러스터 백업 및 복원를 참조하십시오.

질문:

보조 노드로 사용될 수 있는 노드 상태는 언제입니까?

응답:

Solaris 8 및 Solaris 9:

재부트 후 노드가 로그인 프롬프트를 표시하면 해당 노드가 보조 노드가 될 수 있는 상태입니다.

Solaris 10:

multi-user-server 시점이 실행 중이면 해당 노드가 보조 노드가 될 수 있는 상태입니다.


# svcs -a | grep multi-user-server:default

클러스터 저장소 FAQ

질문:

어떻게 멀티 호스트 저장소의 가용성을 높입니까?

응답:

멀티 호스트 저장소는 한 개의 디스크가 손실되더라도 미러링이나 하드웨어 기반 RAID-5 컨트롤러를 통해 계속 사용할 수 있기 때문에 가용성이 높습니다. 멀티 호스트 저장소는 여러 개의 연결을 갖고 있으므로 연결된 노드 중 하나가 손상되더라도 작동을 계속할 수 있습니다. 또한 호스트 버스 어댑터, 케이블 또는 디스크 컨트롤러의 오류에 대해 각 노드에서 연결된 저장소까지의 중복 경로가 허용됩니다.

클러스터 상호 연결 FAQ

질문:

어떤 클러스터 상호 연결이 Sun Cluster 시스템을 지원합니까?

응답:

현재 Sun Cluster 시스템에서는 다음 클러스터 상호 연결을 지원합니다.

질문:

“케이블”과 전송 “경로”의 차이점은 무엇입니까?

응답:

클러스터 전송 케이블은 전송 어댑터와 스위치를 사용하여 구성합니다. 케이블은 구성 요소끼리 연결하는 방식으로 어댑터와 스위치를 결합시킵니다. 클러스터 토폴로지 관리자는 사용 가능한 케이블을 통해 노드 사이에 종단 간 전송 경로를 구축합니다. 케이블이 직접 전송 경로에 매핑되지는 않습니다.

케이블은 관리자에 의해 정적으로 “활성화”되고 “비활성화”됩니다. 케이블에는 “상태(state)”(활성 또는 비활성)는 있지만 “상태(status)”는 없습니다. 케이블이 비활성화되면 구성되지 않은 것으로 간주됩니다. 비활성화된 케이블은 전송 경로로 사용할 수 없습니다. 이 케이블은 검사를 하지 않으므로 상태를 알 수 없습니다. 케이블 상태를 확인하려면 scconf -p 명령을 사용합니다.

전송 경로는 클러스터 토폴로지 관리자에 의해 동적으로 구성됩니다. 전송 경로의 “상태(status)”는 토폴로지 관리자에 의해 결정됩니다. 경로에는 “온라인” 또는 “오프라인” 상태(status)가 있습니다. 전송 경로의 상태를 확인하려면 scstat(1M) 명령을 사용합니다.

다음은 케이블이 네 개인 2-노드 클러스터의 예입니다.


node1:adapter0      to switch1, port0
node1:adapter1      to switch2, port0
node2:adapter0      to switch1, port1
node2:adapter1      to switch2, port1

이 네 개의 케이블로 두 개의 전송 경로를 만들 수 있습니다.


node1:adapter0    to node2:adapter0
node2:adapter1    to node2:adapter1

클라이언트 시스템 FAQ

질문:

클러스터에서 사용할 경우 특수 클라이언트 요구 사항이나 제한 사항을 고려해야 합니까?

응답:

클라이언트 시스템은 다른 서버에서와 마찬가지로 클러스터에 연결합니다. 어떤 경우에는 데이터 서비스 응용 프로그램에 따라, 클라이언트가 데이터 서비스 응용 프로그램에 연결할 수 있도록 클라이언트측 소프트웨어를 설치하거나 다른 구성 변경 사항을 수행해야 할 수도 있습니다. 클라이언트측 구성 요구 사항에 대한 자세한 내용은 Sun Cluster Data Services Planning and Administration Guide for Solaris OS의 1 장, Planning for Sun Cluster Data Services를 참조하십시오.

관리 콘솔 FAQ

질문:

Sun Cluster 시스템에 관리 콘솔이 필요합니까?

응답:

예.

질문:

관리 콘솔은 클러스터 전용이어야 합니까? 아니면, 다른 작업에도 사용할 수 있습니까?

응답:

Sun Cluster 시스템에는 전용 관리 콘솔이 필요하지 않지만 전용 관리 콘솔을 사용하면 다음과 같은 이점이 있습니다.

질문:

관리 콘솔을 클러스터에 “가까이”(예: 같은 방) 놓아야 합니까?

응답:

하드웨어 서비스 제공업체에 확인해 보십시오. 제공업체는 콘솔을 클러스터와 근접한 곳에 놓으라고 요청할 수 있습니다. 콘솔이 같은 방에 있어야 할 기술적인 이유는 없습니다.

질문:

거리 요구 사항이 모두 충족되면 관리 콘솔이 둘 이상의 클러스터를 서비스할 수 있습니까?

응답:

예. 하나의 관리 콘솔에서 여러 클러스터를 제어할 수 있습니다. 또한 클러스터 사이에서 하나의 단말기 집중 장치를 공유할 수도 있습니다.

단말기 집중 장치 및 시스템 서비스 프로세서 FAQ

질문:

Sun Cluster 시스템에 단말기 집중 장치가 필요합니까?

응답:

Sun Cluster 3.0으로 시작하는 모든 소프트웨어 릴리스는 단말기 집중 장치 없이 실행됩니다. 장애 방지를 위해 단말기 집중 장치가 필요했던 Sun Cluster 2.2 제품과는 달리, 이후 버전의 제품에서는 단말기 집중 장치가 반드시 필요하지는 않습니다.

질문:

대부분의 Sun Cluster 서버는 단말기 집중 장치를 사용하지만 Sun Enterprise E1000 서버는 사용하지 않습니다. 그 이유는 무엇입니까?

응답:

단말기 집중 장치는 실제로 대부분의 서버에서 직렬-이더넷 변환기로 사용되기 때문에단말기 집중 장치의 콘솔 포트는 직렬 포트입니다. Sun Enterprise E1000 서버에는 직렬 콘솔이 없습니다. SSP (System Service Processor)는 이더넷이나 jtag 포트를 통한 콘솔입니다. Sun Enterprise E1000 서버에서는 항상 SSP를 콘솔로 사용합니다.

질문:

단말기 집중 장치를 사용할 경우 어떤 점이 좋습니까?

응답:

단말기 집중 장치를 사용하면 네트워크상의 모든 원격 워크스테이션에서 콘솔 수준으로 각 노드에 액세스할 수 있습니다. 노드가 SPARC 기반 노드의 OpenBoot PROM(OBP)에 있거나 x86 기반 노드의 부트 하위 시스템에 있을 때에도 이런 방식으로 액세스할 수 있습니다.

질문:

Sun에서 지원하지 않는 단말기 집중 장치를 사용할 경우 알아야 할 사항은 무엇입니까?

응답:

Sun에서 지원하는 단말기 집중 장치와 다른 콘솔 장치의 가장 큰 차이점은 Sun의 단말기 집중 장치에는 특수 펌웨어가 있다는 것입니다. 이 펌웨어는 부트할 때 단말기 집중 장치에서 콘솔로 중단 신호가 전송되지 않도록 합니다. 중단 신호나 중단 신호로 해석될 수 있는 신호를 콘솔로 전송할 수 있는 콘솔 장치가 있으면 중단 신호가 노드를 종료시킵니다.

질문:

Sun에서 지원하는 단말기 집중 장치의 잠긴 포트를 재부트하지 않고 해제할 수 있습니까?

응답:

예. 다시 설정해야 하는 포트 번호를 확인하고 다음 명령을 입력하십시오.


telnet tc
Enter Annex port name or number: cli
annex: su -
annex# admin
admin : reset port_number
admin : quit
annex# hangup
#

Sun에서 지원하는 단말기 집중 장치를 구성하고 관리하는 방법에 대한 자세한 내용은 다음 설명서를 참조하십시오.

질문:

단말기 집중 장치 자체에 장애가 발생하면 어떻게 해야 합니까? 다른 집중 장치를 준비해야 합니까?

응답:

아니요. 단말기 집중 장치에 장애가 발생해도 클러스터의 가용성은 유지됩니다. 집중 장치가 다시 서비스를 제공할 때까지 노드 콘솔에 연결할 수 없게 됩니다.

질문:

단말기 집중 장치를 사용할 경우에 보안 문제는 없습니까?

응답:

일반적으로 단말기 집중 장치는 시스템 관리자가 사용하는 소규모 네트워크에 연결되며 다른 클라이언트 액세스에 사용되는 네트워크에는 연결되지 않습니다. 특수 네트워크에 대한 액세스를 제한하여 보안을 제어할 수 있습니다.

질문:

SPARC: 테이프 또는 디스크 드라이브에서 동적 재구성을 어떻게 사용합니까?

응답:

다음 단계를 수행하십시오.


주의 – 주의 –

보조 노드에 대한 DR 작업을 수행할 때 현재 기본 노드에 장애가 발생하면 클러스터 가용성이 영향을 받습니다. 새로운 보조 노드가 제공될 때까지 기본 노드를 페일오버할 수 없습니다.