이 장은 SunPlex 시스템에 대하여 자주 문의하는 사항에 대한 응답으로 구성되어 있습니다. 응답은 주제별로 조직되어 있습니다.
고가용성 시스템이란 정확히 무엇입니까?
SunPlex 시스템은 서버 시스템을 정상적으로 사용할 수 없는 장애가 발생할 경우에도 응용 프로그램을 계속 실행하는 클러스터의 기능을 고가용성(HA)이라고 정의합니다.
클러스터는 어떤 프로세스를 통해 고가용성을 제공합니까?
클러스터 프레임워크는 페일오버라고 하는 프로세스를 통해 고가용성 환경을 제공합니다. 페일오버는 장애가 발생한 노드로부터 작동 중인 다른 노드로 데이터 서비스 자원을 전환하기 위해 클러스터에서 수행하는 일련의 단계입니다.
페일오버와 확장 가능 데이터 서비스 간의 차이점은 무엇입니까?
데이터 서비스에는 페일오버와 확장 가능 두 가지의 주요 기능이 있습니다.
페일오버 데이터 서비스는 클러스터에서 한 번에 하나의 기본 노드에서만 응용 프로그램을 실행합니다. 다른 노드에서는 다른 응용 프로그램을 실행할 수 있지만, 각 응용 프로그램이 하나의 노드에서만 실행됩니다. 기본 노드가 실패할 경우, 실패한 노드에서 실행되는 응용 프로그램은 다른 노드로 페일오버하여 실행을 계속합니다.
확장 가능 서비스는 하나의 응용 프로그램을 여러 노드에 분산시켜서 하나의 논리 서비스를 작성합니다. 확장 가능 서비스는 실행되는 전체 클러스터에서 여러 노드와 프로세스를 조정합니다.
응용 프로그램마다 하나의 노드가 클러스터에 대한 물리적 인터페이스를 호스트합니다. 이러한 노드를 GIF(Global Interface) 노드라고 합니다. 클러스터에는 여러 개의 GIF 노드가 있을 수 있습니다. 각 GIF 노드는 확장 가능한 서비스에서 사용할 수 있는 하나 이상의 논리 인터페이스를 호스트합니다. 이러한 논리 인터페이스를 전역 인터페이스라고 합니다. 하나의 GIF 노드가 전역 인터페이스를 호스트하여 특정 응용 프로그램에 대한 모든 요청을 받고 Application Server를 실행하는 여러 노드로 이 요청을 전달합니다. GIF 노드에 장애가 발생하면 전역 인터페이스가 남아있는 노드로 페일오버합니다.
응용 프로그램을 실행하는 노드에 장애가 발생하면 장애가 발생한 노드가 클러스터에 복귀될 때까지 응용 프로그램이 다른 노드에서 계속 실행되고, 이 경우에는 약간 성능이 떨어집니다.
하나 이상의 클러스터 노드를 가용성이 높은 NFS 서버로 실행하고 다른 클러스터 노드는 클라이언트로 실행할 수 있습니까?
안 됩니다. 루프백 마운트를 하면 안 됩니다.
Resource Group Manager의 제어를 받지 않는 응용 프로그램에 클러스터 파일 시스템을 사용할 수 있습니까?
예. 그러나 RGM 제어가 없으면 응용 프로그램을 실행하고 있는 노드에 장애가 발생할 경우에 직접 응용 프로그램을 다시 시작해야 합니다.
모든 클러스터 파일 시스템에서 /global 디렉토리에 마운트 지점이 있어야 합니까?
아닙니다. 그러나 /global과 같이 동일한 마운트 지점에 클러스터 파일 시스템을 두면 이러한 파일 시스템을 쉽게 구성하고 관리할 수 있습니다.
클러스터 파일 시스템을 사용하는 것과 NFS 파일 시스템을 내보내는 것이 어떤 차이가 있습니까?
몇 가지 차이점이 있습니다.
클러스터 파일 시스템은 전역 장치를 지원합니다. NFS는 장치에 대한 원격 액세스를 지원하지 않습니다.
클러스터 파일 시스템에는 전역 이름 공간이 있습니다. 하나의 마운트 명령만 필요합니다. NFS를 사용할 경우, 각 노드에서 파일 시스템을 마운트해야 합니다.
클러스터 파일 시스템은 NFS를 수행하는 경우보다 많이 파일을 캐시합니다. 예를 들어, 읽기, 쓰기, 파일 잠금 및 비동기 I/O를 위해 여러 노드에서 파일에 액세스합니다.
클러스터 파일 시스템은 향후에 원격 DMA 및 zero-copy 기능을 제공하는 고속 클러스터 상호 연결을 구축할 수 있도록 설계되었습니다.
클러스터 파일 시스템에서 파일에 대한 등록 정보를 변경하면(예를 들어, chmod(1M) 명령 사용), 변경한 내용이 모든 노드에 즉시 적용됩니다. 내보낸 NFS 파일 시스템에서는 이를 수행하는 데 더 많은 시간이 소요될 수 있습니다.
파일 시스템 /global/.devices/node@<nodeID>가 클러스터 노드에 나타납니다. 이 파일 시스템을 사용하여 가용성이 높은 전역 데이터를 저장할 수 있습니까?
이 파일 시스템은 전역 장치 이름 공간을 저장합니다. 이것은 일반적인 용도에 사용하는 파일 시스템이 아닙니다. 데이터는 전역이지만 전역 방식으로 액세스할 수 없습니다. 각 노드는 자체 전역 장치 이름 공간만 액세스합니다. 노드가 중단되면 다른 노드가 중단된 노드에 대한 이름 공간에 액세스할 수 있습니다. 이 파일 시스템은 가용성이 높지 않습니다. 전역 방식으로 액세스하거나 가용성이 높아야 하는 데이터를 저장할 경우에는 이 파일 시스템을 사용하면 안 됩니다.
모든 디스크 장치를 미러해야 합니까?
고가용성으로 간주되는 디스크 장치의 경우에는 미러해야 합니다. 그렇지 않으면, RAID-5 하드웨어를 사용하십시오. 모든 데이터 서비스는 고가용성 디스크 장치나 고가용성 디스크 장치에 마운트된 클러스터 파일 시스템을 사용해야 합니다. 이렇게 구성하면 하나의 디스크에 장애가 발생할 경우에도 안전합니다.
로컬 디스크(부트 디스크)에 하나의 볼륨 관리자를 사용하고 멀티 호스트 디스크에 다른 볼륨 관리자를 사용할 수 있습니까?
SPARC: 로컬 디스크를 관리하는 Solaris 볼륨 관리자 소프트웨어와 멀티 호스트 디스크를 관리하는 VERITAS Volume Manager에서 이 구성이 지원됩니다. 다른 조합은 지원되지 않습니다.
x86: 아닙니다. 이 구성은 지원되지 않습니다. x86 기반 클러스터에서는 Solaris 볼륨 관리자만 지원됩니다.
사용할 수 있는 SunPlex 데이터 서비스는 무엇입니까?
지원되는 데이터 서비스 목록은 Sun Cluster 3.1 9/04 Release Notes for Solaris OS의 “Supported Products”를 참조하십시오.
SunPlex 데이터 서비스에서 지원되는 응용 프로그램 버전은 무엇입니까?
지원되는 응용 프로그램 버전 목록은 Solaris OS용 Sun Cluster 3.1 9/04 릴리스 노트의 “지원 제품”을 참조하십시오.
자체 데이터 서비스를 작성할 수 있습니까?
예. 자세한 내용은 Solaris OS용 Sun Cluster 데이터 서비스 개발 안내서의 “데이터 서비스 개발 라이브러리 참조”를 참조하십시오.
네트워크 자원을 제공할 때 숫자 IP 주소나 호스트 이름을 지정해야 합니까?
네트워크 자원을 지정하는 데는 숫자 IP 주소를 사용하는 것보다 UNIX 호스트 이름을 사용하는 것이 좋습니다.
네트워크 자원을 제공할 때 논리 호스트 이름(LogicalHostname 자원)을 사용하는 것과 공유 주소(SharedAddress 자원)를 사용하는 것이 어떤 차이가 있습니까?
Sun Cluster HA for NFS의 경우가 아니면 문서가 페일오버 모드 자원 그룹의 LogicalHostname 자원을 사용하기 위해 호출할 때마다 SharedAddress 자원 또는 LogicalHostname 자원 중 한 가지를 사용할 수 있습니다. SharedAddress 자원을 사용하면 클러스터 네트워킹 소프트웨어가 SharedAddress에 대해 구성되며, LogicalHostname에 대해 구성되지 않으므로 일부 추가 오버헤드가 발생합니다.
확장 가능 및 페일오버 데이터 서비스를 모두 구성하여 클라이언트가 동일한 호스트 이름을 사용하여 두 서비스에 모두 액세스할 수 있도록 하려는 경우에 SharedAddress를 사용하면 좋습니다. 이 경우에 SharedAddress 자원은 페일오버 응용 프로그램 자원과 함께 자원 그룹에 포함되지만, 확장 가능 서비스 자원은 별도의 자원 그룹에 포함되어 SharedAddress를 사용하도록 구성됩니다. 그러면 확장 가능 서비스와 페일오버 서비스가 모두 SharedAddress 자원에 구성된 동일한 호스트 이름/주소 세트를 사용할 수 있습니다.
어떤 공용 네트워크 어댑터가 SunPlex 시스템을 지원합니까?
현재는 SunPlex 시스템이 이더넷(10/100BASE-T 및 1000BASE-SX Gb) 공용 네트워크 어댑터를 지원합니다. 이후에 새로운 인터페이스가 지원될 수 있으므로 최신 정보는 Sun 영업 담당자에게 문의하십시오.
페일오버에서 MAC 주소의 역할은 무엇입니까?
페일오버가 발생할 경우, 새로운 ARP(Address Resolution Protocol) 패킷이 생성되어 전체에 브로드캐스팅됩니다. 이러한 ARP 패킷에는 새로운 MAC 주소(노드가 페일오버한 새로운 물리적 어댑터와 이전 IP 주소가 있습니다. 네트워크의 다른 시스템이 패킷 중 하나를 수신할 경우 그 시스템은 해당 ARP 캐시에서 이전 MAC-IP 매핑을 지우고 새 매핑 정보를 사용합니다.
SunPlex 시스템은 local-mac-address?=true 설정을 지원합니까?
예. 실제로 IP Network Multipathing에서는 local-mac-address?가 true로 설정되어야 합니다.
SPARC 기반 클러스터의 OpenBoot PROM ok 프롬프트에서 eeprom(1M)을 사용하여 local-mac-address?를 설정할 수 있습니다. x86 기반 클러스터에서는 BIOS 부트 이후 선택적으로 실행하는 SCSI 유틸리티를 사용하여 설정할 수 있습니다.
IP Network Multipathing에서 어댑터 스위치오버를 수행할 때 어느 정도 지연될 수 있습니까?
몇 분 동안 지연될 수 있습니다. 이것은 IP Network Multipathing 전환이 수행될 때 ARP를 외부로 전송하기 때문입니다. 그러나 클라이언트와 클러스터 사이의 라우터가 반드시 ARP를 사용하는 것은 아닙니다. 따라서 라우터에서 이 IP 주소에 대한 ARP 캐시 항목의 시간이 만료될 때까지 이전의 MAC 주소를 사용할 수 있습니다.
네트워크 어댑터 오류가 얼마나 빨리 감지됩니까?
기본 오류 감지 시간은 10초입니다. 알고리즘에서 오류 감지 시간을 맞추려 하지만 실제 시간은 네트워크 로드에 따라 달라집니다.
모든 클러스터 구성원이 동일한 루트 암호를 사용해야 합니까?
각 클러스터 구성원에서 동일한 루트 암호를 가질 필요는 없습니다. 그러나 모든 노드에서 동일한 루트 암호를 사용하면 쉽게 클러스터를 관리할 수 있습니다.
노드의 부트 순서가 중요합니까?
대부분의 경우에는 그렇지 않습니다. 그러나 정보 유실을 방지하기 위해서는 부트 순서가 중요합니다(정보 유실에 대한 내용은 장애 차단 정보 참조). 예를 들어, 노드 2가 쿼럼 장치를 소유하고 있을 때 노드 1이 중단된 상태에서 사용자가 노드 2를 중단시키면 노드 1을 다시 실행하기 전에 노드 2를 먼저 실행해야 합니다. 그러면, 클러스터 구성 정보 날짜가 지난 노드를 가져오는 일이 없어집니다.
클러스터 노드에서 로컬 디스크를 미러해야 합니까?
예. 이러한 미러링이 반드시 필요한 것은 아니지만, 클러스터 노드 디스크를 미러하면 디스크를 미러하지 않을 경우에 발생할 수 있는 노드 중단을 방지할 수 있습니다. 클러스터 노드의 로컬 디스크를 미러하면 시스템 관리에 오버헤드가 부가됩니다.
클러스터 구성원을 백업하는 데는 어떤 문제가 있습니까?
하나의 클러스터에 대해 여러 가지 백업 방법을 사용할 수 있습니다. 한 가지 방법은 노드 하나를 테이프 드라이브/라이브러리가 연결된 백업 노드로 사용하는 것입니다. 그리고 나서, 데이터를 백업하기 위해 클러스터 파일 시스템을 사용합니다. 이 노드를 공유 디스크에 연결하지는 마십시오.
데이터 백업 및 복원 방법에 대한 추가 정보는 Solaris OS용 Sun Cluster 시스템 관리 안내서의 “클러스터 백업 및 복원”을 참조하십시오.
보조 노드로 사용될 수 있는 노드 상태는 언제입니까?
재부트 후 노드가 로그인 프롬프트를 표시하면 해당 노드가 보조 노드가 될 수 있는 상태입니다.
어떻게 멀티 호스트 저장소의 가용성을 높입니까?
멀티 호스트 저장소는 하나의 디스크에 장애가 발생한 후에도 미러링이나 하드웨어 기반 RAID-5 컨트롤러를 통해 계속 사용할 수 있기 때문에 가용성이 높습니다. 멀티 호스트 저장 장치는 여러 개의 연결을 갖고 있으므로 연결된 노드 중 하나가 손상되더라도 작동을 계속할 수 있습니다. 또한 호스트 버스 어댑터, 케이블 또는 디스크 컨트롤러의 오류에 대해 각 노드에서 연결된 저장소까지의 중복 경로가 허용됩니다.
SunPlex 시스템에서 지원하는 클러스터 상호 연결은 무엇입니까?
현재 SunPlex 시스템은 SPARC 기반 및 x86 기반 클러스터 모두에서 이더넷(100BASE-T Fast Ethernet 및 1000BASE-SX Gb) 클러스터 상호 연결을 지원합니다. SunPlex 시스템은 SPARC 기반 클러스터에서만 SCI 네트워크 인터페이스 클러스터 상호 연결을 지원합니다.
“케이블”과 전송 “경로” 사이에는 어떤 차이가 있습니까?
클러스터 전송 케이블은 전송 어댑터와 스위치를 사용하여 구성됩니다. 케이블은 구성 요소끼리 연결하는 방식으로 어댑터와 스위치를 결합시킵니다. 클러스터 토폴로지 관리자는 사용 가능한 케이블을 통해 노드 사이에 종단 간 전송 경로를 구축합니다. 케이블이 직접 전송 경로에 매핑되지는 않습니다.
케이블은 관리자에 의해 정적으로 “활성화”되고 “비활성화”됩니다. 케이블의 상태는 활성화 또는 비활성화된 “정적인 상태(state)”를 말하는 것이지, “동적인 상태(status)”를 말하는 것이 아닙니다. 케이블이 비활성화되면 구성되지 않은 것으로 간주됩니다. 비활성화된 케이블은 전송 경로로 사용할 수 없습니다. 비활성화된 케이블은 검사 대상이 아니므로 상태를 알 수 없습니다. 케이블의 상태는 scconf -p 명령을 사용하여 볼 수 있습니다.
전송 경로는 클러스터 토폴로지 관리자에 의해 동적으로 구성됩니다. 전송 경로의 “상태(status)”는 토폴로지 관리자에 의해 결정됩니다. 경로의 상태는 “온라인” 또는 “오프라인”일 수 있습니다. 전송 경로의 상태는 scstat(1M)를 사용하여 확인할 수 있습니다.
다음은 케이블이 4개인 2 노드 클러스터의 예입니다.
node1:adapter0 to switch1, port0 node1:adapter1 to switch2, port0 node2:adapter0 to switch1, port1 node2:adapter1 to switch2, port1 |
네 개의 케이블로 두 개의 전송 경로를 만들 수 있습니다.
node1:adapter0 to node2:adapter0 node2:adapter1 to node2:adapter1 |
클러스터에서 사용할 경우 특수 클라이언트 요구 사항이나 제한 사항을 고려해야 합니까?
클라이언트 시스템은 다른 서버에서처럼 클러스터에 연결합니다. 어떤 경우에는 데이터 서비스 응용 프로그램에 따라, 클라이언트가 데이터 서비스 응용 프로그램에 연결할 수 있도록 클라이언트측 소프트웨어를 설치하거나 다른 구성 변경 사항을 수행해야 할 수도 있습니다. 클라이언트측 구성 요구 사항에 대한 자세한 내용은 Sun Cluster Data Services Planning and Administration Guide의 해당 장을 참조하십시오.
SunPlex 시스템에 관리 콘솔이 필요합니까?
예.
관리 콘솔은 클러스터 전용이어야 합니까? 아니면, 다른 작업에도 사용할 수 있습니까?
SunPlex 시스템에는 전용 관리 콘솔이 필요하지 않지만, 전용 관리 콘솔을 사용하면 다음과 같은 이점이 있습니다.
동일한 시스템에서 콘솔과 관리 도구를 그룹화하여 중앙에서 클러스터를 관리할 수 있습니다.
하드웨어 서비스 제공업체에서 더욱 신속하게 문제를 분석할 수 있습니다.
관리 콘솔이 클러스터에 “가까이”(예: 같은 방) 있어야 합니까?
하드웨어 서비스 제공업체에 확인해 보십시오. 제공업체에서 클러스터 자체에 근접하게 콘솔이 위치되도록 요구할 수도 있습니다. 콘솔이 같은 방에 위치되어야 하는 기술적인 이유는 없습니다.
거리 요구 사항이 일단 충족되면 관리 콘솔이 둘 이상의 클러스터에 서비스를 제공할 수 있습니까?
예. 하나의 관리 콘솔에서 여러 클러스터를 제어할 수 있습니다. 또한 클러스터 사이에서 하나의 단말기 집중 장치를 공유할 수도 있습니다.
SunPlex 시스템에 단말기 집중 장치가 필요합니까?
Sun Cluster 3.0으로 시작하는 모든 소프트웨어 버전은 단말기 집중 장치 없이 실행됩니다. 장애를 방지하기 위해 단말기 집중 장치가 필요했던 Sun Cluster 2.2 제품과 달리, 이후 버전에서는 단말기 집중 장치가 반드시 필요하지는 않습니다.
대부분의 SunPlex 서버에서 단말기 집중 장치를 사용하는데 Sun Enterprise E10000 server는 이것을 사용하지 않습니다. 그 이유는 무엇입니까?
단말기 집중 장치는 실제로 대부분의 서버에서 직렬-이더넷 변환기로 사용되기 때문에해당되는 콘솔 포트는 직렬 포트입니다. 그러나 Sun Enterprise E10000 server에는 직렬 콘솔이 없습니다. SSP(System Service Processor)는 이더넷이나 jtag 포트를 통한 콘솔입니다. Sun Enterprise E10000 server에서는 항상 SSP를 콘솔로 사용합니다.
단말기 집중 장치를 사용할 경우 어떤 점이 좋습니까?
단말기 집중 장치를 사용하면 SPARC 기반 노드가 OpenBoot PROM(OBP)에 있거나 x86 기반 노드가 부트 하위 시스템에 있을 경우를 비롯하여 네트워크의 모든 원격 워크스테이션에서 각 노드에 콘솔 수준으로 액세스할 수 있습니다.
Sun에서 지원하지 않는 단말기 집중 장치를 사용할 경우, 어떤 사항을 알아야 합니까?
Sun에서 지원하는 단말기 집중 장치와 다른 콘솔 장치의 가장 큰 차이점은 Sun 단말기 집중 장치에는 부트할 때 콘솔로 중단 신호가 전송되지 않도록 하는 특수 펌웨어가 있다는 것입니다. 중단 신호나 중단 신호로 해석될 수 있는 신호를 콘솔로 전송할 수 있는 콘솔 장치가 있으면 이 장치가 노드를 종료시킵니다.
Sun에서 지원하는 단말기 집중 장치의 잠긴 포트를 재부트하지 않고 해제할 수 있습니까?
예. 다시 설정해야 하는 포트 번호를 확인하고 다음 명령을 입력하십시오.
telnet tc Enter Annex port name or number: cli annex: su - annex# admin admin : reset port_number admin : quit annex# hangup # |
Sun에서 지원되는 단말기 집중 장치의 구성 및 관리 방법에 대한 자세한 내용은 다음 설명서를 참조하십시오.
단말기 집중 장치 자체가 실패할 경우에는 어떻습니까? 다른 단말기 집중 장치를 준비해야 합니까?
아니요. 단말기 집중 장치에 장애가 발생해도 클러스터의 가용성은 유지됩니다. 집중 장치가 다시 서비스를 제공할 때까지 노드 콘솔에 연결할 수 없게 됩니다.
단말기 집중 장치를 사용할 경우에 보안 문제는 없습니까?
일반적으로, 단말기 집중 장치는 시스템 관리자가 사용되는 소규모 네트워크에 접속되며, 다른 클라이언트 액세스에 사용되는 네트워크에는 접속되지 않습니다. 특수 네트워크에 대한 액세스를 제한하여 보안을 제어할 수 있습니다.
SPARC: 테이프 또는 디스크 드라이브에서 동적 재구성을 어떻게 사용합니까?
디스크나 테이프 드라이브가 현재 작동하는 장치 그룹에 포함되었는지 확인하십시오. 드라이브가 현재 작동하는 장치 그룹에 포함되지 않았으면 드라이브에 대하여 DR 제거 작업을 수행할 수 있습니다.
DR 보드 제거 작업이 현재 작동하는 디스크나 테이프 드라이브에 영향을 줄 경우에는 시스템이 작업을 거부하고 작업의 영향을 받을 드라이브를 식별합니다. 드라이브가 현재 작동하는 장치 그룹에 포함되었으면 SPARC: 디스크 및 테이프 드라이브에 대한 DR 클러스터링 고려 사항으로 이동하십시오.
드라이브가 기본 노드의 구성 요소인지 아니면 보조 노드의 구성 요소인지 확인하십시오. 드라이브가 보조 노드의 구성 요소이면 DR 제거 작업을 수행할 수 있습니다.
드라이브가 기본 노드의 구성 요소이면 DR 제거 작업을 수행하기 전에 기본 노드와 보조 노드를 전환해야 합니다.
보조 노드에 대한 DR 작업을 수행할 때 현재 기본 노드에 장애가 발생하면 클러스터 가용성이 영향을 받습니다. 새로운 보조 노드가 제공될 때까지 기본 노드를 페일오버할 수 없습니다.