이 장에서는 유지보수용 또는 클러스터 장애의 결과로 인한 서비스 마이그레이션에 대한 정보를 제공합니다. 이 장은 다음 내용으로 구성되어 있습니다.
이 절에서는 1차 또는 2차 클러스터에서 실패가 검출될 때 발생하는 내부 프로세스에 대해 설명합니다.
주어진 보호 그룹에 대한 1차 클러스터가 실패하면 파트너쉽의 2차 클러스터가 실패를 검출합니다. 실패하는 클러스터가 둘 이상의 파트너쉽의 구성원일 수 있으며, 이 경우 복수 실패 검출이 발생합니다.
1차 클러스터 실패가 발생할 때 다음 조치가 발생합니다. 실패 중에 적합한 보호 그룹이 Unknown 상태에 있습니다.
심박동 실패가 파트너 클러스터에 의해 검출됩니다.
심박동이 비상 모드로 활성화되어 심박동 유실이 일시적 현상이 아니며 1차 클러스터가 실패했음을 확인합니다. 심박동 메커니즘이 1차 클러스터를 계속 재시도하는 동안 심박동은 이 기본 시간초과 간격 중에 Online 상태를 유지합니다.
이 조회 간격은 Query_interval 심박동 등록 정보를 사용하여 설정됩니다. 사용자가 구성한 간격 후에도 심박동이 여전히 실패하는 경우 심박동 유실 이벤트가 생성되고 시스템 로그에 기록됩니다. 기본 간격을 사용할 때 비상 모드 재시도 작동이 약 9분 동안 심박동 유실 통지를 지연시킬 수 있습니다. 그래픽 사용자 인터페이스(GUI)와 geoadm status 명령 출력에 메시지가 표시됩니다.
기록에 대한 자세한 정보는 Sun Cluster Geographic Edition 로그 메시지 보기를 참조하십시오.
주어진 보호 그룹에 대한 2차 클러스터가 실패하면 동일한 파트너쉽의 클러스터가 실패를 검출합니다. 실패한 클러스터가 둘 이상의 파트너쉽의 구성원일 수 있으며, 이 경우 복수 실패 검출이 발생합니다.
실패 검출 중에 다음 조치가 발생합니다.
심박동 실패가 파트너 클러스터에 의해 검출됩니다.
2차 클러스터가 정지되었는지 확인하기 위해 심박동이 비상 모드로 활성화됩니다.
클러스터가 관리자에게 통지합니다. 시스템이 실패한 클러스터가 2차로서 작용 중이었던 모든 보호 그룹을 검출합니다. 적합한 보호 그룹의 상태가 Unknown으로 표시됩니다.
파트너 클러스터로 서비스를 순차적으로 이전하려는 경우 Hitachi TrueCopy 보호 그룹의 작업 전환을 수행합니다. 작업 전환은 다음으로 구성됩니다.
응용 프로그램 서비스는 이전 1차 클러스터인 cluster-paris에서 오프라인입니다.
cluster-paris가 어떤 클러스터인지 다시 보려면 그림 2–1을 참조하십시오.
데이터 복제 역할이 반전되고 이제 새 1차 클러스터인 cluster-newyork에서 이전의 1차 클러스터인 cluster-paris로 실행하기 시작합니다.
응용 프로그램 서비스가 새 1차 클러스터인 cluster-newyork에서 온라인 상태가 됩니다.
작업 전환이 geopg switchover 명령을 사용하여 시작될 때 데이터 복제 서브시스템이 두 클러스터 모두에서 여러 가지 검증을 실행합니다. 작업 전환은 검증 단계가 두 클러스터 모두에서 성공하는 경우에만 수행됩니다.
첫 번째로, 복제 서브시스템이 Hitachi TrueCopy 장치 그룹이 올바른 총계 장치 그룹 상태에 있는지 점검합니다. 그런 다음, 대상 1차 클러스터 cluster-newyork의 로컬 장치 그룹 상태가 23, 33, 43 또는 53인지 점검합니다. 로컬 장치 그룹 상태는 pairvolchk -g device-group-name -ss 명령에 의해 리턴됩니다. 이 값들은 PVOL_PAIR 또는 SVOL_PAIR 상태에 대응합니다. 새 1차 클러스터 cluster-newyork에 주어진 Hitachi TrueCopy 명령이 다음 표에 설명되어 있습니다.
표 11–1 새 1차 클러스터에서 Hitachi TrueCopy 작업 전환 검증
총계 장치 그룹 상태 |
로컬 클러스터의 올바른 장치 그룹 상태 |
cluster-newyork에서 실행되는 Hitachi TrueCopy 작업 전환 명령 |
---|---|---|
SMPL |
없음 |
없음 |
정상 기본 |
23, 43 |
Hitachi TrueCopy 장치 그룹이 이미 PVOL_PAIR 상태에 있기 때문에 실행되는 명령이 없습니다. |
정상 보조 |
33, 53 |
horctakeover -g dg [-t] Hitachi TrueCopy 장치 그룹의 fence_level이 async일 때 -t 옵션이 제공됩니다. 값은 보호 그룹의 시간초과 등록 정보의 80%로 계산됩니다. 예를 들어 보호 그룹이 200초의 시간초과를 갖는 경우 이 명령에 사용되는 -t의 값은 200초의 80%인 160초입니다. |
인계 기본 |
없음 |
없음 |
인계 보조 |
없음 |
없음 |
작업 전환 성공 후 데이터 복제 레벨에서 1차 및 2차 볼륨의 역할이 전환되었습니다. 사전 작업 전환 PVOL_PAIR 볼륨이 SVOL_PAIR 볼륨이 됩니다. 사전 작업 전환 SVOL_PAIR 볼륨이 PVOL_PAIR 볼륨이 됩니다. 새로운 PVOL_PAIR 볼륨에서 새로운 SVOL_PAIR 볼륨으로의 데이터 복제가 계속됩니다.
응용 프로그램이 작업 전환 조작의 일부로서 새 1차 클러스터에서 온라인 될 수 있는지 여부와 상관없이 보호 그룹의 Local-role 등록 정보도 전환됩니다. 보호 그룹이 Secondary의 로컬 역할을 가진 클러스터에서 보호 그룹의 로컬 역할이 Primary가 됩니다. 보호 그룹이 Primary의 로컬 역할을 가진 클러스터에서 보호 그룹의 로컬 역할이 Secondary가 됩니다.
성공적인 작업 전환을 위해 데이터 복제는 1차와 2차 클러스터 사이에서 활성화되어야 하고 두 클러스터의 데이터 볼륨은 동기화되어야 합니다.
보호 그룹을 1차 클러스터에서 2차 클러스터로 작업 전환하기 전에 다음 조건이 만족되는지 확인하십시오.
Sun Cluster Geographic Edition 소프트웨어가 두 클러스터 모두에서 가동되고 실행 중입니다.
2차 클러스터가 파트너쉽의 구성원입니다.
두 클러스터 파트너 모두에 접근할 수 있습니다.
보호 그룹이 OK 상태에 있습니다.
Cluster_dgs 등록 정보를 구성한 경우, 보호 그룹에 속한 응용 프로그램만이 Cluster_dgs 등록 정보에 지정된 장치 그룹에 기록할 수 있습니다.
클러스터 노드 중 하나에 로그인합니다.
이 절차를 완료하려면 Geo Management RBAC 권리 프로파일이 지정되어야 합니다. RBAC에 대한 자세한 정보는 Sun Cluster Geographic Edition 소프트웨어와 RBAC를 참조하십시오.
작업 전환을 시작합니다.
보호 그룹의 일부인 응용 프로그램 자원 그룹이 작업 전환 중에 정지되고 시작됩니다.
# geopg switchover [-f] -m new-primary-cluster protection-group-name |
사용자에게 확인을 요청하지 않고 강제로 명령이 조작을 수행하도록 합니다.
보호 그룹에 대한 새 1차 클러스터가 될 클러스터의 이름을 지정합니다.
보호 그룹의 이름을 지정합니다.
다음 예는 2차 클러스터로 작업 전환을 수행하는 방법을 보여줍니다.
# geopg switchover -f -m cluster-newyork tcpg |
데이터가 1차 볼륨과 2차 볼륨 사이에서 완전히 일치하는지 여부와 상관없이 응용 프로그램이 2차 클러스터에서 온라인이 되어야 할 때 작업 인계를 수행해야 합니다. 작업 인계가 시작될 때 다음 단계가 발생합니다.
이전의 1차 클러스터인 cluster-paris에 접근할 수 있는 경우 응용 프로그램 서비스가 이전의 1차 클러스터에서 오프라인이 됩니다.
cluster-paris가 어떤 클러스터인지 다시 보려면 그림 2–1을 참조하십시오.
이전 1차 클러스터 cluster-paris의 데이터 볼륨이 새 1차 클러스터 cluster-newyork에 의해 인계됩니다.
이 데이터가 원래 1차 볼륨과 일치하지 않을 수 있습니다. 작업 인계 후, 새로운 1차 클러스터인 cluster-newyork 에서 이전 1차 클러스터인 cluster-paris로의 데이터 복제가 정지됩니다.
응용 프로그램 서비스가 새 1차 클러스터인 cluster-newyork에서 온라인 상태가 됩니다.
작업 인계 전후의 1차 및 2차 클러스터의 가능 조건에 대한 세부사항은 부록 C, 작업 인계 사후 조건을 참조하십시오.
다음 절에서는 2차 클러스터에 의한 작업 인계를 강제로 수행하는 데 필요한 단계를 설명합니다.
작업 인계가 geopg takeover 명령을 사용하여 시작될 때 데이터 복제 서브시스템이 두 클러스터 모두에서 여러 가지 검증을 실행합니다. 이 단계는 1차 클러스터에 접근할 수 있는 경우에만 원래의 1차 클러스터에서 수행됩니다. 원래 1차 클러스터에서의 검증이 실패하는 경우 작업 인계가 여전히 발생합니다.
우선, 복제 서브시스템이 Hitachi TrueCopy 장치 그룹이 올바른 총계 장치 그룹 상태에 있는지 점검합니다. 그런 다음, 복제 서브시스템이 대상 1차 클러스터 cluster-newyork의 로컬 장치 그룹 상태가 32 또는 52가 아닌지 확인합니다. 이 값들은 horctakeover 명령이 실패하는 SVOL_COPY 상태에 해당합니다. 작업 인계에 사용되는 Hitachi TrueCopy 명령이 다음 표에 설명되어 있습니다.
표 11–2 새 1차 클러스터에서 Hitachi TrueCopy 작업 인계 검증
총계 장치 그룹 상태 |
올바른 로컬 상태 장치 그룹 상태 |
cluster-newyork에서 실행되는 Hitachi TrueCopy 작업 인계 명령 |
---|---|---|
SMPL |
모두 |
실행되는 명령이 없습니다. |
정상 기본 |
모두 |
실행되는 명령이 없습니다. |
정상 보조 |
32 또는 52를 제외한 모든 정상 보조 상태 |
horctakeover -S -g dg [- t] Hitachi TrueCopy 장치 그룹의 fence_level이 async일 때 -t 옵션이 제공됩니다. 값은 보호 그룹의 시간초과 등록 정보의 80%로 계산됩니다. 예를 들어 보호 그룹이 200초의 시간초과를 갖는 경우 이 명령에 사용되는 -t의 값은 200초의 80%인 160초입니다. |
인계 기본 |
모두 |
실행되는 명령이 없습니다. |
인계 보조 |
모두 |
pairsplit -R-g dg pairsplit -S-g dg |
복제의 관점에서, 작업 인계가 성공한 후 응용 프로그램이 작업 인계 조작의 일부로서 새 1차 클러스터에서 온라인될 수 있는지 여부와 상관없이 보호 그룹의 Local-role 등록 정보가 새 역할을 반영하도록 변경됩니다. 보호 그룹이 Secondary의 로컬 역할을 가진 cluster-newyork에서 보호 그룹의 로컬 역할이 Primary가 됩니다. 보호 그룹이 Primary의 로컬 역할을 가진 cluster-paris에서, 다음이 발생할 수 있습니다.
클러스터에 접근할 수 있는 경우 보호 그룹의 로컬 역할이 Secondary가 됩니다.
클러스터에 접근할 수 없는 경우 보호 그룹의 로컬 역할이 Primary로 유지됩니다.
작업 인계가 성공하면 응용 프로그램이 온라인이 됩니다. 별도의 geopg start 명령을 실행할 필요가 없습니다.
작업 인계가 성공한 후, 새 1차 클러스터 cluster-newyork과 이전 1차 클러스터 cluster-paris 사이의 데이터 복제가 정지됩니다. geopg start 명령을 실행하려는 경우 복제가 재개되지 않도록 -n 옵션을 사용해야 합니다.
2차 클러스터가 1차 클러스터의 활동을 가정하게 하려면 다음 조건이 만족되었는지 확인하십시오.
Sun Cluster Geographic Edition 소프트웨어가 클러스터에서 가동되고 실행 중입니다.
클러스터가 파트너쉽의 구성원입니다.
보호 그룹의 구성 상태가 2차 클러스터에서 OK입니다.
2차 클러스터의 노드에 로그인합니다.
이 절차를 완료하려면 Geo Management RBAC 권리 프로파일이 지정되어야 합니다. RBAC에 대한 자세한 정보는 Sun Cluster Geographic Edition 소프트웨어와 RBAC를 참조하십시오.
작업 인계를 시작합니다.
# geopg takeover [-f] protection-group-name |
사용자 확인 없이 강제로 명령이 조작을 수행하도록 합니다.
보호 그룹의 이름을 지정합니다.
다음 예제는 2차 클러스터 cluster-newyork에 의한 tcpg의 작업 인계 강제 수행 방법을 보여줍니다.
phys-newyork-1은 2차 클러스터의 첫 번째 노드입니다. 어떤 노드가 phys-newyork-1인지 다시 보려면 Sun Cluster Geographic Edition 클러스터 구성 예를 참조하십시오.
phys-newyork-1# geopg takeover -f tcpg |
작업 인계 조작이 성공한 후 2차 클러스터(cluster-newyork )가 보호 그룹에 대한 1차 클러스터가 되고 서비스가 2차 클러스터에서 온라인입니다. 원래의 1차 클러스터가 복구된 후,서비스는 장애 복구라는 프로세스를 사용하여 원래의 1차 클러스터인 cluster-paris에서 다시 온라인이 될 수 있습니다.
Sun Cluster Geographic Edition 소프트웨어는 다음 두 종류의 장애 복구를 지원합니다.
장애 복구-작업 전환. 장애 복구-작업 전환 중에, 원래 1차 클러스터의 데이터가 2차 클러스터 cluster-newyork의 데이터와 재동기화된 후 응용 프로그램이 원래 1차 클러스터 cluster-paris에서 다시 온라인이 됩니다.
cluster-paris 및 cluster-newyork이 어떤 클러스터인지 다시 보려면 그림 2–1을 참조하십시오.
장애 복구-작업 인계. 장애 복구-작업 인계 중에 응용 프로그램이 원래 1차 클러스터 cluster-paris에서 다시 온라인이 되고 원래 1차 클러스터의 현재 데이터를 사용합니다. 2차 클러스터 cluster-newyork이 1차 클러스터로서 활동하고 있는 동안 이 클러스터에서 발생한 모든 업데이트가 삭제됩니다.
이 클러스터의 데이터가 현재 1차 클러스터 cluster-newyork의 데이터와 재동기화된 후 원래의 1차 클러스터 cluster-paris에서 응용 프로그램을 재시작하려면 이 절차를 사용하십시오.
장애 복구-작업 전환을 수행하기 전에 작업 인계가 cluster-newyork에서 발생했습니다. 클러스터는 이제 다음 역할을 갖습니다.
원래의 1차 클러스터 cluster-paris가 정지된 경우 클러스터가 부트되고 Sun Cluster Geographic Edition 기반구조가 클러스터에서 활성화되었는지 확인합니다. 클러스터 부트에 대한 자세한 정보는 클러스터 부트를 참조하십시오.
cluster-newyork의 보호 그룹은 primary 역할을 갖습니다.
cluster-paris의 보호 그룹은 작업 인계 중에 보호 그룹에 접근할 수 있는지 여부에 따라서 primary 역할 또는 secondary 역할을 갖습니다.
원래의 1차 클러스터인 cluster-paris 를 현재의 1차 클러스터인 cluster-newyork와 재동기화합니다.
cluster-paris는 고유 구성을 상실하고 cluster-newyork 구성을 지역적으로 복제합니다. 파트너쉽 및 보호 그룹 구성을 재동기화합니다.
cluster-paris에서, 파트너쉽을 재동기화합니다.
# geops update partnership-name |
파트너쉽의 이름을 지정합니다.
복수 보호 그룹에 대해 장애 복구-작업 전환을 수행 중인 경우에도 이 단계를 한 번만 수행해야 합니다.
파트너쉽 동기화에 대한 자세한 정보는 파트너쉽 재동기화를 참조하십시오.
cluster-paris에서 각 보호 그룹을 재동기화합니다.
cluster-newyork 의 보호 그룹 역할이 primary이기 때문에 이 단계에서는 cluster-paris의 보호 그룹 역할이 secondary 임을 확인합니다.
# geopg update protection-group-name |
보호 그룹의 이름을 지정합니다.
보호 그룹 동기화에 대한 자세한 정보는 Hitachi TrueCopy 보호 그룹 재동기화 를 참조하십시오.
cluster-paris에서 각 보호 그룹에 대한 클러스터의 구성을 검증합니다.
# geopg validate protection-group-name |
단일 보호 그룹을 식별하는 고유한 이름을 지정합니다.
자세한 정보는 Hitachi TrueCopy 보호 그룹 검증 방법 을 참조하십시오.
cluster-paris에서 각 보호 그룹을 활성화합니다.
cluster-paris의 보호 그룹이 secondary의 역할을 갖기 때문에, geopg start 명령이 cluster-paris에서 응용 프로그램을 재시작하지 않습니다.
# geopg start -e local protection-group-name |
명령의 범위를 지정합니다.
local 범위를 지정하면 명령이 로컬 클러스터에서만 작동합니다.
보호 그룹의 이름을 지정합니다.
-n 옵션은 데이터가 현재 1차인 cluster-newyork에서 현재 2차인 cluster-paris로 동기화되어야 하기 때문에 장애 복구 전환을 수행할 때 제공되어서는 안됩니다.
보호 그룹에 2차의 역할이 있기 때문에 데이터가 현재 1차인 cluster-newyork에서 현재 2차인 cluster-paris로 동기화됩니다.
geopg start 명령에 대한 자세한 정보는 Hitachi TrueCopy 보호 그룹 활성화 방법 을 참조하십시오.
작업 전환을 수행하기지 전에 데이터가 완전히 동기화되기를 기다립니다.
cluster-newyork의 보호 그룹 상태가 OK일 때 데이터가 완전히 동기화됩니다. cluster-newyork의 Hitachi TrueCopy 장치 그룹이 PVOL_PAIR의 상태를 갖고 cluster-paris의 Hitachi TrueCopy 장치 그룹이 SVOL_PAIR의 상태를 가질 때 보호 그룹은 OK의 로컬 상태를 갖습니다.
cluster-newyork의 보호 그룹 상태가 OK인지 확인하려면 다음 명령을 사용하십시오.
phys-newyork-1# geoadm status |
출력의 Protection Group 섹션을 참조하십시오.
클러스터 중 하나에서 각 보호 그룹에 대해 cluster-newyork 에서 cluster-paris로의 작업 전환을 수행합니다.
# geopg switchover [-f] -m cluster-paris protection-group-name |
자세한 정보는 1차에서 2차로 Hitachi TrueCopy 보호 그룹을 작업 전환하는 방법을 참조하십시오.
cluster-paris가 보호 그룹에 대한 1차 클러스터로서 원래 역할을 재개합니다.
원래의 1차 클러스터 cluster-paris에서 응용 프로그램을 재시작하고 원래 1차 클러스터의 현재 데이터를 사용하려면 이 절차를 사용하십시오. 2차 클러스터 cluster-newyork가 1차 클러스터로서 활동하고 있는 동안 이 클러스터에서 발생한 모든 업데이트가 삭제됩니다.
조건에 따라, 원래의 1차 클러스터 cluster-paris의 데이터 사용을 재개할 수 있습니다. cluster-newyork 에 대한 작업 인계 조작 후 임의의 지점에서 새 1차 클러스터 cluster-newyork에서 원래의 1차 클러스터 cluster-paris 로 데이터를 복제하지 않아야 합니다. 새 1차 클러스터와 원래의 1차 클러스터 사이의 데이터 복제를 막으려면 geopg start 명령을 사용할 때마다 -n 옵션을 사용해야만 합니다.
장애 조치-작업 인계 조작을 시작하기 전에 클러스터는 다음 역할을 갖습니다.
cluster-newyork의 보호 그룹은 primary 역할을 갖습니다.
cluster-paris의 보호 그룹은 작업 인계 중에 보호 그룹에 접근할 수 있는지 여부에 따라서 primary 역할 또는 secondary 역할을 갖습니다.
원래 1차 클러스터 cluster-paris를 원래 2차 클러스터 cluster-newyork와 재동기화하십시오.
cluster-paris는 고유 구성을 상실하고 cluster-newyork 구성을 지역적으로 복제합니다.
cluster-paris에서, 파트너쉽을 재동기화합니다.
# geops update partnership-name |
파트너쉽의 이름을 지정합니다.
복수 보호 그룹에 대해 장애 복구-작업 인계를 수행 중인 경우에도 이 단계를 한 번만 수행해야 합니다.
파트너쉽 동기화에 대한 자세한 정보는 파트너쉽 재동기화를 참조하십시오.
Hitachi TrueCopy 장치 그룹 devgroup1을 SMPL 상태에 둡니다.
pairsplit 명령을 사용하여 cluster-paris 및 cluster-newyork 모두의 보호 그룹에 있는 Hitachi TrueCopy 장치 그룹을 SMPL 상태에 둡니다. 사용하는 pairsplit 명령은 Hitachi TrueCopy 장치 그룹의 쌍 상태에 달려있습니다. 다음 표는 몇몇 전형적인 쌍 상태에 대해 cluster-paris에서 사용해야 하는 명령의 몇 가지 예를 제공합니다.
cluster-paris의 쌍 상태 |
cluster-newyork의 쌍 상태 |
cluster-paris에서 사용되는 pairsplit 명령 |
---|---|---|
PSUS 또는 PSUE |
SSWS |
pairsplit -R -g dgname pairsplit -S -g dgname |
SSUS |
PSUS |
pairsplit -S -g dgname |
pairsplit명령에 대한 자세한 정보는 Sun StorEdge SE 9900 V Series Command and Control Interface User and Reference Guide를 참조하십시오.
명령이 성공하는 경우 devgroup1의 상태가 pairdisplay 명령의 출력에 다음과 같이 주어집니다.
phys-paris-1# pairdisplay -g devgroup1 Group PairVol(L/R) (Port#,TID,LU),Seq#,LDEV#,P/S,Status,Fence,Seq#,P-LDEV# M devgroup1 pair1(L) (CL1-A , 0, 1) 12345 1..SMPL ---- ----,----- ---- - devgroup1 pair1(R) (CL1-C , 0, 20)54321 609..SMPL ---- ----,----- ---- - devgroup1 pair2(L) (CL1-A , 0, 2) 12345 2..SMPL ---- ----,----- ---- - devgroup1 pair2(R) (CL1-C , 0,21) 54321 610..SMPL ---- ----,----- ---- - |
.
cluster-paris에서 각 보호 그룹을 재동기화합니다.
cluster-newyork 의 보호 그룹의 로컬 역할이 지금 primary이기 때문에 이 단계는 cluster-paris의 보호 그룹의 로컬 역할이 secondary이도록 합니다 .
# geopg update protection-group-name |
보호 그룹의 이름을 지정합니다.
보호 그룹 재동기화에 대한 자세한 정보는 보호 그룹 재동기화 방법을 참조하십시오.
cluster-paris에서 각 보호 그룹에 대한 클러스터의 구성을 검증합니다.
# geopg validate protection-group-name |
단일 보호 그룹을 식별하는 고유한 이름을 지정합니다.
자세한 정보는 Hitachi TrueCopy 보호 그룹 검증 방법 을 참조하십시오.
cluster-paris에서, 데이터 복제 없이 보조 역할의 각 보호 그룹을 활성화합니다.
cluster-paris의 보호 그룹이 secondary의 역할을 갖기 때문에 geopg start 명령이 cluster-paris에서 응용 프로그램을 재시작하지 않습니다.
# geopg start -e local -n protection-group-name |
명령의 범위를 지정합니다.
local 범위를 지정하면 명령이 로컬 클러스터에서만 작동합니다.
보호 그룹 시작 시에 데이터 복제의 시작을 막습니다.
-n 옵션을 사용해야 합니다.
보호 그룹의 이름을 지정합니다.
자세한 정보는 Hitachi TrueCopy 보호 그룹 활성화 방법 을 참조하십시오.
-n 옵션이 cluster-paris에서 주어지기 때문에 cluster-newyork에서 cluster-paris로의 복제가 시작되지 않습니다.
cluster-paris에서, 각 보호 그룹에 대한 작업 인계를 시작합니다.
# geopg takeover [-f] protection-group-name |
사용자 확인 없이 강제로 명령이 조작을 수행하도록 합니다.
보호 그룹의 이름을 지정합니다.
geopg takeover 명령에 대한 자세한 정보는 2차 클러스터에 의한 Hitachi TrueCopy 서비스의 즉시 작업 인계 강제 수행 방법을 참조하십시오.
cluster-paris의 보호 그룹이 이제 primary 역할을 갖고, cluster-newyork의 보호 그룹은 secondary 역할을 갖습니다. 응용 프로그램 서비스가 이제 cluster-paris에서 온라인입니다.
cluster-newyork에서 각 보호 그룹을 활성화합니다.
4단계의 끝에서 cluster-newyork의 보호 그룹 로컬 상태가 Offline입니다. 보호 그룹의 로컬 상태 모니터링을 시작하려면 cluster-newyork에서 보호 그룹을 활성화해야 합니다.
cluster-newyork의 보호 그룹이 secondary의 역할을 갖기 때문에, geopg start 명령이 cluster-newyork에서 응용 프로그램을 재시작하지 않습니다.
# geopg start -e local [-n] protection-group-name |
명령의 범위를 지정합니다.
local 범위를 지정하면 명령이 로컬 클러스터에서만 작동합니다.
보호 그룹 시작 시에 데이터 복제의 시작을 막습니다.
이 옵션을 생략하면 데이터 복제 서브시스템이 보호 그룹과 동시에 시작합니다.
보호 그룹의 이름을 지정합니다.
geopg start 명령에 대한 자세한 정보는 Hitachi TrueCopy 보호 그룹 활성화 방법 을 참조하십시오.
geopg switchover 명령이 실행될 때 horctakeover 명령이 Hitachi TrueCopy 데이터 복제 레벨에서 실행됩니다. horctakeover 명령이 1의 값을 리턴하는 경우 작업 전환이 성공합니다.
Hitachi TrueCopy 전문용어에서는 작업 전환을 스왑 인계(swap-takeover)라고 합니다. 일부 경우에 horctakeover 명령이 스왑 인계를 수행할 수 없는 경우도 있습니다. 이러한 경우에는 1 이외의 리턴 값이 리턴되며, 이는 작업 전환 실패로 간주됩니다.
실패 경우에 대해 horctakeover 명령이 5의 값을 리턴하며, 이는 SVOL-SSUS-takeover를 표시합니다.
horctakeover 명령이 스왑 인계를 수행하지 못하는 한 가지 이유는 데이터 복제 링크 ESCON/FC가 정지되었기 때문입니다.
스왑 인계 이외의 모든 결과는 2차 볼륨이 1차 볼륨과 완전히 동기화되지 않았을 수 있음을 의미합니다. Sun Cluster Geographic Edition 소프트웨어는 작업 전환 실패 시나리오에서 새로 의도된 1차 클러스터에 응용 프로그램을 가동하지 않습니다.
이 절의 나머지는 작업 전환 실패를 이끄는 초기 조건과 작업 전환 실패에서 복구하는 방법에 대해 설명합니다.
이 절에서는 작업 전환 실패 시나리오 예를 설명합니다. 이 시나리오에서, cluster-paris가 원래 1차 클러스터이고 cluster-newyork 이 원래 2차 클러스터입니다.
다음과 같이 cluster-paris에서 cluster-newyork으로 서비스를 전환하기 위한 작업 전환이 실행됩니다.
phys-newyork-1# geopg switchover -f -m cluster-newyork tcpg |
geopg switchover 명령을 처리하는 동안 horctakeover 명령이 SVOL-SSUS-takeover를 실행하고 Hitachi TrueCopy 장치 그룹 devgroup1에 대해 값 5를 리턴합니다. 결과적으로 geopg switchover 명령이 다음 실패 메시지와 함께 리턴합니다.
Processing operation.... this may take a while .... "Switchover" failed for the following reason: Switchover failed for Truecopy DG devgroup1 |
이 실패 메시지가 발행된 후 두 클러스터는 다음 상태에 있습니다.
cluster-paris: tcpg role: Secondary cluster-newyork: tcpg role: Secondary phys-newyork-1# pairdisplay -g devgroup1 -fc Group PairVol(L/R) (Port#,TID,LU),Seq#,LDEV#.P/S, Status,Fence,%, P-LDEV# M devgroup1 pair1(L) (CL1-C , 0, 20)12345 609..S-VOL SSWS ASYNC,100 1 - devgroup1 pair1(R) (CL1-A , 0, 1) 54321 1..P-VOL PSUS ASYNC,100 609 - |
이 절에서는 이전 절에서 설명하는 실패 시나리오에서 복구하기 위한 절차를 설명합니다. 이들 절차는 적당한 클러스터에서 응용 프로그램을 온라인으로 만듭니다.
Hitachi TrueCopy 장치 그룹 devgroup1을 SMPL 상태에 둡니다.
pairsplit 명령을 사용하여 cluster-paris 및 cluster-newyork 모두의 보호 그룹에 있는 장치 그룹을 SMPL 상태에 둡니다. 이절 절에서 표시되는 쌍 상태에 대해 다음 pairsplit 명령이 실행되어야 합니다.
phys-newyork-1# pairsplit -R -g devgroup1 phys-newyork-1# pairsplit -S -g devgroup1 |
클러스터 중 하나를 보호 그룹에 대한 Primary로 만듭니다.
원래의 1차 클러스터에서 응용 프로그램을 가동하려는 경우 원래 1차 클러스터 cluster-paris를 보호 그룹에 대한 1차로 만듭니다. 응용 프로그램은 원래 1차 클러스터의 현재 데이터를 사용합니다.
원래 2차 클러스터에서 응용 프로그램을 가동하려는 경우 원래 2차 클러스터 cluster-newyork를 보호 그룹에 대한 1차로 만듭니다. 응용 프로그램은 원래 2차 클러스터의 현재 데이터를 사용합니다.
horctakeover 명령이 스왑 인계를 수행하지 않았기 때문에 cluster-newyork의 데이터 볼륨이 cluster-paris의 데이터 볼류과 동기화되지 않을 수 있습니다. 원래의 1차 클러스터와 동일하게 나타나는 데이터를 사용하여 응용 프로그램을 작동하려는 경우 원래 2차 클러스터를 1차로 만들지 않아야 합니다.
원래 1차 클러스터의 보호 그룹을 비활성화합니다.
phys-paris-1# geopg stop -e Local tcpg |
보호 그룹의 구성을 재동기화합니다.
이 명령은 cluster-newyork의 보호 그룹의 구성 정보로 cluster-paris 의 보호 그룹의 구성을 업데이트합니다.
phys-paris-1# geopg update tcpg |
geopg update 명령이 성공적으로 실행된 후 tcpg는 각 클러스터에서 다음 역할을 갖습니다.
cluster-paris: tcpg role: Primary cluster-newyork: tcpg role: secondary |
파트너쉽의 두 클러스터 모두에서 보호 그룹을 활성화합니다.
phys-paris-1# geopg start -e Global tcpg |
이 명령은 cluster-paris의 응용 프로그램을 작동시킵니다. cluster-paris에서 cluster-newyork 로 데이터 복제가 시작됩니다.
보호 그룹의 구성을 재동기화합니다.
이 명령은 cluster-paris의 보호 그룹의 구성 정보로 cluster-newyork의 보호 그룹의 구성을 업데이트합니다.
phys-newyork-1# geopg update tcpg |
geopg update 명령이 성공적으로 실행된 후 tcpg는 각 클러스터에서 다음 역할을 갖습니다.
cluster-paris: tcpg role: Secondary cluster-newyork: tcpg role: Primary |
파트너쉽의 두 클러스터 모두에서 보호 그룹을 활성화합니다.
phys-newyork-1# geopg start -e Global tcpg |
이 명령은 cluster-newyork의 응용 프로그램을 작동시킵니다. cluster-newyork에서 cluster-paris로의 데이터 복제가 시작됩니다.
이 명령은 cluster-paris의 데이터를 겹쳐씁니다.
데이터 복제 레벨에서 오류가 발생할 때 오류가 관련 장치 그룹의 복제 자원 그룹의 자원 상태에 반영됩니다.
데이터 복제 레벨에서 오류가 발생할 때 오류가 관련 장치 그룹의 복제 자원 그룹의 자원 상태에 반영됩니다.
Resource status 값이 실제 복제 쌍 상태에 맵핑될 때의 차이를 보려면 표 10–6을 참조하십시오.
다음과 같이 scstat -g 명령을 사용하여 복제 자원의 상태를 점검할 수 있습니다.
phys-paris-1# scstat -g |
scstat -g 명령을 실행하면 다음이 리턴될 수 있습니다.
... --Resources -- Resource Name Node Name State Status Message ------------- --------- ----- -------------- Resource: r-tc-tcpg1-devgroup1 phys-paris-2 Offline Offline Resource: r-tc-tcpg1-devgroup1 phys-paris-1 Online Faulted - P-VOL:PSUE Resource: hasp4nfs phys-paris-1 Offline Offline Resource: hasp4nfs phys-paris-2 Offline Offline ... |
보호 그룹의 모든 장치 그룹에 대한 총계 자원 상태는 geoadm status 명령을 사용하여 주어집니다. 예를 들어, 앞선 예에서 scstat -g 명령의 결과는 Hitachi TrueCopy 장치 그룹 devgroup1 이cluster-paris 에서 PSUE 상태인지 나타냅니다. 표 10–6은 PSUE 상태가 FAULTED의 자원 상태와 일치하는지 나타냅니다. 따라서 보호 그룹의 데이터 복제 상태도 FAULTED입니다. 이 상태는 geoadm status 명령의 출력에 반영되는데, 보호 그룹의 상태를 Error 로 표시합니다.
phys-paris-1# geoadm status Cluster: cluster-paris Partnership "paris-newyork-ps" : OK Partner clusters : cluster-newyork Synchronization : OK Heartbeat "paris-to-newyork" monitoring "cluster-newyork": OK Heartbeat plug-in "ping_plugin" : Inactive Heartbeat plug-in "icrm_plugin" : OK Heartbeat plug-in "tcp_udp_plugin" : OK Protection group "tcpg" : Error Partnership : paris-newyork-ps Synchronization : OK Cluster cluster-paris : Error Role : Primary PG activation state : Activated Configuration : OK Data replication : Error Resource groups : OK Cluster cluster-newyork : Error Role : Secondary PG activation state : Activated Configuration : OK Data replication : Error Resource groups : OK Pending Operations Protection Group : "tcpg" Operations : start |
오류 상태에서 복구하기 위해 다음 절차의 단계를 모두 또는 일부 수행할 수 있습니다.
Hitachi TrueCopy 문서의 절차를 사용하여 FAULTED 상태의 원인을 판별하십시오. 이 상태는 PSUE로 표시됩니다.
Hitachi TrueCopy 절차를 사용하여 오류 상태에서 복구합니다.
복구 절차가 장치 그룹의 상태를 변경하는 경우 이 상태는 자원에 의해 자동으로 검출되며 새 보호 그룹 상태로서 보고됩니다.
보호 그룹 구성을 재검증합니다.
phys-paris-1# geopg validate protection-group-name |
Hitachi TrueCopy 보호 그룹의 이름을 지정합니다.
보호 그룹 구성의 상태를 검토합니다.
phys-paris-1# geopg list protection-group-name |
Hitachi TrueCopy 보호 그룹의 이름을 지정합니다.
보호 그룹의 런타임 상태를 검토합니다.
phys-paris-1# geoadm status |