Sun Cluster Geographic Edition 시스템 관리 설명서

11장 Hitachi TrueCopy 데이터 복제를 사용하는 서비스 마이그레이션

이 장에서는 유지보수용 또는 클러스터 장애의 결과로 인한 서비스 마이그레이션에 대한 정보를 제공합니다. 이 장은 다음 내용으로 구성되어 있습니다.

Hitachi TrueCopy 데이터 복제를 사용하는 시스템의 클러스터 실패 검출

이 절에서는 1차 또는 2차 클러스터에서 실패가 검출될 때 발생하는 내부 프로세스에 대해 설명합니다.

1차 클러스터 실패 검출

주어진 보호 그룹에 대한 1차 클러스터가 실패하면 파트너쉽의 2차 클러스터가 실패를 검출합니다. 실패하는 클러스터가 둘 이상의 파트너쉽의 구성원일 수 있으며, 이 경우 복수 실패 검출이 발생합니다.

1차 클러스터 실패가 발생할 때 다음 조치가 발생합니다. 실패 중에 적합한 보호 그룹이 Unknown 상태에 있습니다.

2차 클러스터 실패 검출

주어진 보호 그룹에 대한 2차 클러스터가 실패하면 동일한 파트너쉽의 클러스터가 실패를 검출합니다. 실패한 클러스터가 둘 이상의 파트너쉽의 구성원일 수 있으며, 이 경우 복수 실패 검출이 발생합니다.

실패 검출 중에 다음 조치가 발생합니다.

작업 전환으로 Hitachi TrueCopy 데이터 복제를 사용하는 서비스 마이그레이션

파트너 클러스터로 서비스를 순차적으로 이전하려는 경우 Hitachi TrueCopy 보호 그룹의 작업 전환을 수행합니다. 작업 전환은 다음으로 구성됩니다.

작업 전환 전 발생하는 검증

작업 전환이 geopg switchover 명령을 사용하여 시작될 때 데이터 복제 서브시스템이 두 클러스터 모두에서 여러 가지 검증을 실행합니다. 작업 전환은 검증 단계가 두 클러스터 모두에서 성공하는 경우에만 수행됩니다.

첫 번째로, 복제 서브시스템이 Hitachi TrueCopy 장치 그룹이 올바른 총계 장치 그룹 상태에 있는지 점검합니다. 그런 다음, 대상 1차 클러스터 cluster-newyork의 로컬 장치 그룹 상태가 23, 33, 43 또는 53인지 점검합니다. 로컬 장치 그룹 상태는 pairvolchk -g device-group-name -ss 명령에 의해 리턴됩니다. 이 값들은 PVOL_PAIR 또는 SVOL_PAIR 상태에 대응합니다. 새 1차 클러스터 cluster-newyork에 주어진 Hitachi TrueCopy 명령이 다음 표에 설명되어 있습니다.

표 11–1 새 1차 클러스터에서 Hitachi TrueCopy 작업 전환 검증

총계 장치 그룹 상태 

로컬 클러스터의 올바른 장치 그룹 상태 

cluster-newyork에서 실행되는 Hitachi TrueCopy 작업 전환 명령

SMPL 

없음 

없음 

정상 기본 

23, 43 

Hitachi TrueCopy 장치 그룹이 이미 PVOL_PAIR 상태에 있기 때문에 실행되는 명령이 없습니다.

정상 보조 

33, 53 

horctakeover -g dg [-t]

Hitachi TrueCopy 장치 그룹의 fence_levelasync일 때 -t 옵션이 제공됩니다. 값은 보호 그룹의 시간초과 등록 정보의 80%로 계산됩니다. 예를 들어 보호 그룹이 200초의 시간초과를 갖는 경우 이 명령에 사용되는 -t의 값은 200초의 80%인 160초입니다.

인계 기본 

없음 

없음 

인계 보조 

없음 

없음 

복제 Perspective에서 작업 전환의 결과

작업 전환 성공 후 데이터 복제 레벨에서 1차 및 2차 볼륨의 역할이 전환되었습니다. 사전 작업 전환 PVOL_PAIR 볼륨이 SVOL_PAIR 볼륨이 됩니다. 사전 작업 전환 SVOL_PAIR 볼륨이 PVOL_PAIR 볼륨이 됩니다. 새로운 PVOL_PAIR 볼륨에서 새로운 SVOL_PAIR 볼륨으로의 데이터 복제가 계속됩니다.

응용 프로그램이 작업 전환 조작의 일부로서 새 1차 클러스터에서 온라인 될 수 있는지 여부와 상관없이 보호 그룹의 Local-role 등록 정보도 전환됩니다. 보호 그룹이 Secondary로컬 역할을 가진 클러스터에서 보호 그룹의 로컬 역할Primary가 됩니다. 보호 그룹이 Primary로컬 역할을 가진 클러스터에서 보호 그룹의 로컬 역할Secondary가 됩니다.

Procedure1차에서 2차로 Hitachi TrueCopy 보호 그룹을 작업 전환하는 방법

시작하기 전에

성공적인 작업 전환을 위해 데이터 복제는 1차와 2차 클러스터 사이에서 활성화되어야 하고 두 클러스터의 데이터 볼륨은 동기화되어야 합니다.

보호 그룹을 1차 클러스터에서 2차 클러스터로 작업 전환하기 전에 다음 조건이 만족되는지 확인하십시오.


주의 – 주의 –

Cluster_dgs 등록 정보를 구성한 경우, 보호 그룹에 속한 응용 프로그램만이 Cluster_dgs 등록 정보에 지정된 장치 그룹에 기록할 수 있습니다.


단계
  1. 클러스터 노드 중 하나에 로그인합니다.

    이 절차를 완료하려면 Geo Management RBAC 권리 프로파일이 지정되어야 합니다. RBAC에 대한 자세한 정보는 Sun Cluster Geographic Edition 소프트웨어와 RBAC를 참조하십시오.

  2. 작업 전환을 시작합니다.

    보호 그룹의 일부인 응용 프로그램 자원 그룹이 작업 전환 중에 정지되고 시작됩니다.


    # geopg switchover [-f] -m new-primary-cluster protection-group-name
    
    -f

    사용자에게 확인을 요청하지 않고 강제로 명령이 조작을 수행하도록 합니다.

    -m 새_1차_클러스터

    보호 그룹에 대한 새 1차 클러스터가 될 클러스터의 이름을 지정합니다.

    보호_그룹_이름

    보호 그룹의 이름을 지정합니다.


예 11–1 1차에서 2차로 강제 작업 전환

다음 예는 2차 클러스터로 작업 전환을 수행하는 방법을 보여줍니다.


# geopg switchover -f -m cluster-newyork tcpg

Hitachi TrueCopy 데이터 복제를 사용하는 시스템에서 강제 작업 인계

데이터가 1차 볼륨과 2차 볼륨 사이에서 완전히 일치하는지 여부와 상관없이 응용 프로그램이 2차 클러스터에서 온라인이 되어야 할 때 작업 인계를 수행해야 합니다. 작업 인계가 시작될 때 다음 단계가 발생합니다.

작업 인계 전후의 1차 및 2차 클러스터의 가능 조건에 대한 세부사항은 부록 C, 작업 인계 사후 조건을 참조하십시오.

다음 절에서는 2차 클러스터에 의한 작업 인계를 강제로 수행하는 데 필요한 단계를 설명합니다.

작업 인계 전 발생하는 검증

작업 인계가 geopg takeover 명령을 사용하여 시작될 때 데이터 복제 서브시스템이 두 클러스터 모두에서 여러 가지 검증을 실행합니다. 이 단계는 1차 클러스터에 접근할 수 있는 경우에만 원래의 1차 클러스터에서 수행됩니다. 원래 1차 클러스터에서의 검증이 실패하는 경우 작업 인계가 여전히 발생합니다.

우선, 복제 서브시스템이 Hitachi TrueCopy 장치 그룹이 올바른 총계 장치 그룹 상태에 있는지 점검합니다. 그런 다음, 복제 서브시스템이 대상 1차 클러스터 cluster-newyork의 로컬 장치 그룹 상태가 32 또는 52가 아닌지 확인합니다. 이 값들은 horctakeover 명령이 실패하는 SVOL_COPY 상태에 해당합니다. 작업 인계에 사용되는 Hitachi TrueCopy 명령이 다음 표에 설명되어 있습니다.

표 11–2 새 1차 클러스터에서 Hitachi TrueCopy 작업 인계 검증

총계 장치 그룹 상태 

올바른 로컬 상태 장치 그룹 상태 

cluster-newyork에서 실행되는 Hitachi TrueCopy 작업 인계 명령

SMPL 

모두 

실행되는 명령이 없습니다. 

정상 기본 

모두 

실행되는 명령이 없습니다. 

정상 보조 

32 또는 52를 제외한 모든 정상 보조 상태 

정상 보조 상태의 목록을 보려면 표 10–1표 10–2를 참조하십시오.

horctakeover -S -g dg [- t]

Hitachi TrueCopy 장치 그룹의 fence_levelasync일 때 -t 옵션이 제공됩니다. 값은 보호 그룹의 시간초과 등록 정보의 80%로 계산됩니다. 예를 들어 보호 그룹이 200초의 시간초과를 갖는 경우 이 명령에 사용되는 -t의 값은 200초의 80%인 160초입니다.

인계 기본 

모두 

실행되는 명령이 없습니다. 

인계 보조 

모두 

pairsplit -R-g dg pairsplit -S-g dg

복제 Perspective에서 작업 인계의 결과

복제의 관점에서, 작업 인계가 성공한 후 응용 프로그램이 작업 인계 조작의 일부로서 새 1차 클러스터에서 온라인될 수 있는지 여부와 상관없이 보호 그룹의 Local-role 등록 정보가 새 역할을 반영하도록 변경됩니다. 보호 그룹이 Secondary로컬 역할을 가진 cluster-newyork에서 보호 그룹의 로컬 역할Primary가 됩니다. 보호 그룹이 Primary로컬 역할을 가진 cluster-paris에서, 다음이 발생할 수 있습니다.

작업 인계가 성공하면 응용 프로그램이 온라인이 됩니다. 별도의 geopg start 명령을 실행할 필요가 없습니다.


주의 – 주의 –

작업 인계가 성공한 후, 새 1차 클러스터 cluster-newyork과 이전 1차 클러스터 cluster-paris 사이의 데이터 복제가 정지됩니다. geopg start 명령을 실행하려는 경우 복제가 재개되지 않도록 -n 옵션을 사용해야 합니다.


Procedure2차 클러스터에 의한 Hitachi TrueCopy 서비스의 즉시 작업 인계 강제 수행 방법

시작하기 전에

2차 클러스터가 1차 클러스터의 활동을 가정하게 하려면 다음 조건이 만족되었는지 확인하십시오.

단계
  1. 2차 클러스터의 노드에 로그인합니다.

    이 절차를 완료하려면 Geo Management RBAC 권리 프로파일이 지정되어야 합니다. RBAC에 대한 자세한 정보는 Sun Cluster Geographic Edition 소프트웨어와 RBAC를 참조하십시오.

  2. 작업 인계를 시작합니다.


    # geopg takeover [-f] protection-group-name
    
    -f

    사용자 확인 없이 강제로 명령이 조작을 수행하도록 합니다.

    보호_그룹_이름

    보호 그룹의 이름을 지정합니다.


예 11–2 2차 클러스터에 의한 작업 인계 강제 수행

다음 예제는 2차 클러스터 cluster-newyork에 의한 tcpg의 작업 인계 강제 수행 방법을 보여줍니다.

phys-newyork-1은 2차 클러스터의 첫 번째 노드입니다. 어떤 노드가 phys-newyork-1인지 다시 보려면 Sun Cluster Geographic Edition 클러스터 구성 예를 참조하십시오.


phys-newyork-1# geopg takeover -f tcpg

Hitachi TrueCopy 복제를 사용하는 시스템에서 원래의 1차 클러스터로 서비스 장애 복구

작업 인계 조작이 성공한 후 2차 클러스터(cluster-newyork )가 보호 그룹에 대한 1차 클러스터가 되고 서비스가 2차 클러스터에서 온라인입니다. 원래의 1차 클러스터가 복구된 후,서비스는 장애 복구라는 프로세스를 사용하여 원래의 1차 클러스터인 cluster-paris에서 다시 온라인이 될 수 있습니다.

Sun Cluster Geographic Edition 소프트웨어는 다음 두 종류의 장애 복구를 지원합니다.

ProcedureHitachi TrueCopy 복제를 사용하는 시스템에서 장애 복구-작업 전환을 수행하는 방법

이 클러스터의 데이터가 현재 1차 클러스터 cluster-newyork의 데이터와 재동기화된 후 원래의 1차 클러스터 cluster-paris에서 응용 프로그램을 재시작하려면 이 절차를 사용하십시오.

시작하기 전에

장애 복구-작업 전환을 수행하기 전에 작업 인계가 cluster-newyork에서 발생했습니다. 클러스터는 이제 다음 역할을 갖습니다.

단계
  1. 원래의 1차 클러스터인 cluster-paris 를 현재의 1차 클러스터인 cluster-newyork와 재동기화합니다.

    cluster-paris는 고유 구성을 상실하고 cluster-newyork 구성을 지역적으로 복제합니다. 파트너쉽 및 보호 그룹 구성을 재동기화합니다.

    1. cluster-paris에서, 파트너쉽을 재동기화합니다.


      # geops update partnership-name
      
      파트너쉽_이름

      파트너쉽의 이름을 지정합니다.


      주 –

      복수 보호 그룹에 대해 장애 복구-작업 전환을 수행 중인 경우에도 이 단계를 한 번만 수행해야 합니다.


      파트너쉽 동기화에 대한 자세한 정보는 파트너쉽 재동기화를 참조하십시오.

    2. cluster-paris에서 각 보호 그룹을 재동기화합니다.

      cluster-newyork 의 보호 그룹 역할이 primary이기 때문에 이 단계에서는 cluster-paris의 보호 그룹 역할이 secondary 임을 확인합니다.


      # geopg update protection-group-name
      
      보호_그룹_이름

      보호 그룹의 이름을 지정합니다.

      보호 그룹 동기화에 대한 자세한 정보는 Hitachi TrueCopy 보호 그룹 재동기화 를 참조하십시오.

  2. cluster-paris에서 각 보호 그룹에 대한 클러스터의 구성을 검증합니다.


    # geopg validate protection-group-name 
    
    보호_그룹_이름

    단일 보호 그룹을 식별하는 고유한 이름을 지정합니다.

    자세한 정보는 Hitachi TrueCopy 보호 그룹 검증 방법 을 참조하십시오.

  3. cluster-paris에서 각 보호 그룹을 활성화합니다.

    cluster-paris의 보호 그룹이 secondary의 역할을 갖기 때문에, geopg start 명령이 cluster-paris에서 응용 프로그램을 재시작하지 않습니다.


    # geopg start -e local protection-group-name
    
    -e local

    명령의 범위를 지정합니다.

    local 범위를 지정하면 명령이 로컬 클러스터에서만 작동합니다.

    보호_그룹_이름

    보호 그룹의 이름을 지정합니다.


    주 –

    -n 옵션은 데이터가 현재 1차인 cluster-newyork에서 현재 2차인 cluster-paris로 동기화되어야 하기 때문에 장애 복구 전환을 수행할 때 제공되어서는 안됩니다.


    보호 그룹에 2차의 역할이 있기 때문에 데이터가 현재 1차인 cluster-newyork에서 현재 2차인 cluster-paris로 동기화됩니다.

    geopg start 명령에 대한 자세한 정보는 Hitachi TrueCopy 보호 그룹 활성화 방법 을 참조하십시오.

  4. 작업 전환을 수행하기지 전에 데이터가 완전히 동기화되기를 기다립니다.

    cluster-newyork의 보호 그룹 상태가 OK일 때 데이터가 완전히 동기화됩니다. cluster-newyork의 Hitachi TrueCopy 장치 그룹이 PVOL_PAIR의 상태를 갖고 cluster-paris의 Hitachi TrueCopy 장치 그룹이 SVOL_PAIR의 상태를 가질 때 보호 그룹은 OK의 로컬 상태를 갖습니다.

    cluster-newyork의 보호 그룹 상태가 OK인지 확인하려면 다음 명령을 사용하십시오.


    phys-newyork-1# geoadm status

    출력의 Protection Group 섹션을 참조하십시오.

  5. 클러스터 중 하나에서 각 보호 그룹에 대해 cluster-newyork 에서 cluster-paris로의 작업 전환을 수행합니다.


    # geopg switchover [-f] -m cluster-paris protection-group-name
    

    자세한 정보는 1차에서 2차로 Hitachi TrueCopy 보호 그룹을 작업 전환하는 방법을 참조하십시오.

    cluster-paris가 보호 그룹에 대한 1차 클러스터로서 원래 역할을 재개합니다.

ProcedureHitachi TrueCopy 복제를 사용하는 시스템에서 장애 복구-작업 인계를 수행하는 방법

원래의 1차 클러스터 cluster-paris에서 응용 프로그램을 재시작하고 원래 1차 클러스터의 현재 데이터를 사용하려면 이 절차를 사용하십시오. 2차 클러스터 cluster-newyork가 1차 클러스터로서 활동하고 있는 동안 이 클러스터에서 발생한 모든 업데이트가 삭제됩니다.


주 –

조건에 따라, 원래의 1차 클러스터 cluster-paris의 데이터 사용을 재개할 수 있습니다. cluster-newyork 에 대한 작업 인계 조작 후 임의의 지점에서 새 1차 클러스터 cluster-newyork에서 원래의 1차 클러스터 cluster-paris 로 데이터를 복제하지 않아야 합니다. 새 1차 클러스터와 원래의 1차 클러스터 사이의 데이터 복제를 막으려면 geopg start 명령을 사용할 때마다 -n 옵션을 사용해야만 합니다.


시작하기 전에

장애 조치-작업 인계 조작을 시작하기 전에 클러스터는 다음 역할을 갖습니다.

단계
  1. 원래 1차 클러스터 cluster-paris를 원래 2차 클러스터 cluster-newyork와 재동기화하십시오.

    cluster-paris는 고유 구성을 상실하고 cluster-newyork 구성을 지역적으로 복제합니다.

    1. cluster-paris에서, 파트너쉽을 재동기화합니다.


      # geops update partnership-name
      
      파트너쉽_이름

      파트너쉽의 이름을 지정합니다.


      주 –

      복수 보호 그룹에 대해 장애 복구-작업 인계를 수행 중인 경우에도 이 단계를 한 번만 수행해야 합니다.


      파트너쉽 동기화에 대한 자세한 정보는 파트너쉽 재동기화를 참조하십시오.

    2. Hitachi TrueCopy 장치 그룹 devgroup1을 SMPL 상태에 둡니다.

      pairsplit 명령을 사용하여 cluster-paris cluster-newyork 모두의 보호 그룹에 있는 Hitachi TrueCopy 장치 그룹을 SMPL 상태에 둡니다. 사용하는 pairsplit 명령은 Hitachi TrueCopy 장치 그룹의 쌍 상태에 달려있습니다. 다음 표는 몇몇 전형적인 쌍 상태에 대해 cluster-paris에서 사용해야 하는 명령의 몇 가지 예를 제공합니다.

      cluster-paris의 쌍 상태

      cluster-newyork의 쌍 상태

      cluster-paris에서 사용되는 pairsplit 명령

      PSUS 또는 PSUE

      SSWS

      pairsplit -R -g dgname

      pairsplit -S -g dgname

      SSUS

      PSUS

      pairsplit -S -g dgname

      pairsplit명령에 대한 자세한 정보는 Sun StorEdge SE 9900 V Series Command and Control Interface User and Reference Guide를 참조하십시오.

      명령이 성공하는 경우 devgroup1의 상태가 pairdisplay 명령의 출력에 다음과 같이 주어집니다.


      phys-paris-1# pairdisplay -g devgroup1
      Group PairVol(L/R) (Port#,TID,LU),Seq#,LDEV#,P/S,Status,Fence,Seq#,P-LDEV# M 
      devgroup1 pair1(L) (CL1-A , 0, 1) 12345   1..SMPL ----  ----,-----  ----   - 
      devgroup1 pair1(R) (CL1-C , 0, 20)54321 609..SMPL ----  ----,-----  ----   - 
      devgroup1 pair2(L) (CL1-A , 0, 2) 12345   2..SMPL ----  ----,-----  ----   - 
      devgroup1 pair2(R) (CL1-C , 0,21) 54321 610..SMPL ----  ----,-----  ----   -

      .

    3. cluster-paris에서 각 보호 그룹을 재동기화합니다.

      cluster-newyork 의 보호 그룹의 로컬 역할이 지금 primary이기 때문에 이 단계는 cluster-paris의 보호 그룹의 로컬 역할이 secondary이도록 합니다 .


      # geopg update protection-group-name
      
      보호_그룹_이름

      보호 그룹의 이름을 지정합니다.

      보호 그룹 재동기화에 대한 자세한 정보는 보호 그룹 재동기화 방법을 참조하십시오.

  2. cluster-paris에서 각 보호 그룹에 대한 클러스터의 구성을 검증합니다.


    # geopg validate protection-group-name 
    
    보호_그룹_이름

    단일 보호 그룹을 식별하는 고유한 이름을 지정합니다.

    자세한 정보는 Hitachi TrueCopy 보호 그룹 검증 방법 을 참조하십시오.

  3. cluster-paris에서, 데이터 복제 없이 보조 역할의 각 보호 그룹을 활성화합니다.

    cluster-paris의 보호 그룹이 secondary의 역할을 갖기 때문에 geopg start 명령이 cluster-paris에서 응용 프로그램을 재시작하지 않습니다.


    # geopg start -e local -n protection-group-name
    
    -e local

    명령의 범위를 지정합니다.

    local 범위를 지정하면 명령이 로컬 클러스터에서만 작동합니다.

    -n

    보호 그룹 시작 시에 데이터 복제의 시작을 막습니다.


    주 –

    -n 옵션을 사용해야 합니다.


    보호_그룹_이름

    보호 그룹의 이름을 지정합니다.

    자세한 정보는 Hitachi TrueCopy 보호 그룹 활성화 방법 을 참조하십시오.

    -n 옵션이 cluster-paris에서 주어지기 때문에 cluster-newyork에서 cluster-paris로의 복제가 시작되지 않습니다.

  4. cluster-paris에서, 각 보호 그룹에 대한 작업 인계를 시작합니다.


    # geopg takeover [-f] protection-group-name
    
    -f

    사용자 확인 없이 강제로 명령이 조작을 수행하도록 합니다.

    보호_그룹_이름

    보호 그룹의 이름을 지정합니다.

    geopg takeover 명령에 대한 자세한 정보는 2차 클러스터에 의한 Hitachi TrueCopy 서비스의 즉시 작업 인계 강제 수행 방법을 참조하십시오.

    cluster-paris의 보호 그룹이 이제 primary 역할을 갖고, cluster-newyork의 보호 그룹은 secondary 역할을 갖습니다. 응용 프로그램 서비스가 이제 cluster-paris에서 온라인입니다.

  5. cluster-newyork에서 각 보호 그룹을 활성화합니다.

    4단계의 끝에서 cluster-newyork의 보호 그룹 로컬 상태가 Offline입니다. 보호 그룹의 로컬 상태 모니터링을 시작하려면 cluster-newyork에서 보호 그룹을 활성화해야 합니다.

    cluster-newyork의 보호 그룹이 secondary의 역할을 갖기 때문에, geopg start 명령이 cluster-newyork에서 응용 프로그램을 재시작하지 않습니다.


    # geopg start -e local [-n] protection-group-name
    
    -e local

    명령의 범위를 지정합니다.

    local 범위를 지정하면 명령이 로컬 클러스터에서만 작동합니다.

    -n

    보호 그룹 시작 시에 데이터 복제의 시작을 막습니다.

    이 옵션을 생략하면 데이터 복제 서브시스템이 보호 그룹과 동시에 시작합니다.

    보호_그룹_이름

    보호 그룹의 이름을 지정합니다.

    geopg start 명령에 대한 자세한 정보는 Hitachi TrueCopy 보호 그룹 활성화 방법 을 참조하십시오.

Hitachi TrueCopy 복제를 사용하는 시스템에서 작업 전환 실패에서 복구

geopg switchover 명령이 실행될 때 horctakeover 명령이 Hitachi TrueCopy 데이터 복제 레벨에서 실행됩니다. horctakeover 명령이 1의 값을 리턴하는 경우 작업 전환이 성공합니다.

Hitachi TrueCopy 전문용어에서는 작업 전환을 스왑 인계(swap-takeover)라고 합니다. 일부 경우에 horctakeover 명령이 스왑 인계를 수행할 수 없는 경우도 있습니다. 이러한 경우에는 1 이외의 리턴 값이 리턴되며, 이는 작업 전환 실패로 간주됩니다.


주 –

실패 경우에 대해 horctakeover 명령이 5의 값을 리턴하며, 이는 SVOL-SSUS-takeover를 표시합니다.


horctakeover 명령이 스왑 인계를 수행하지 못하는 한 가지 이유는 데이터 복제 링크 ESCON/FC가 정지되었기 때문입니다.

스왑 인계 이외의 모든 결과는 2차 볼륨이 1차 볼륨과 완전히 동기화되지 않았을 수 있음을 의미합니다. Sun Cluster Geographic Edition 소프트웨어는 작업 전환 실패 시나리오에서 새로 의도된 1차 클러스터에 응용 프로그램을 가동하지 않습니다.

이 절의 나머지는 작업 전환 실패를 이끄는 초기 조건과 작업 전환 실패에서 복구하는 방법에 대해 설명합니다.

작업 전환 실패 조건

이 절에서는 작업 전환 실패 시나리오 예를 설명합니다. 이 시나리오에서, cluster-paris가 원래 1차 클러스터이고 cluster-newyork 이 원래 2차 클러스터입니다.

다음과 같이 cluster-paris에서 cluster-newyork으로 서비스를 전환하기 위한 작업 전환이 실행됩니다.


phys-newyork-1# geopg switchover -f -m cluster-newyork tcpg

geopg switchover 명령을 처리하는 동안 horctakeover 명령이 SVOL-SSUS-takeover를 실행하고 Hitachi TrueCopy 장치 그룹 devgroup1에 대해 값 5를 리턴합니다. 결과적으로 geopg switchover 명령이 다음 실패 메시지와 함께 리턴합니다.


Processing operation.... this may take a while ....
"Switchover" failed for the following reason:
			Switchover failed for Truecopy DG devgroup1

이 실패 메시지가 발행된 후 두 클러스터는 다음 상태에 있습니다.


cluster-paris:
		tcpg role: Secondary
cluster-newyork:
		tcpg role: Secondary

phys-newyork-1# pairdisplay -g devgroup1 -fc 
Group  PairVol(L/R) (Port#,TID,LU),Seq#,LDEV#.P/S, Status,Fence,%, P-LDEV# M 
devgroup1 pair1(L) (CL1-C , 0, 20)12345 609..S-VOL SSWS  ASYNC,100   1    -
devgroup1 pair1(R) (CL1-A , 0, 1) 54321   1..P-VOL PSUS  ASYNC,100  609   -

작업 전환 실패에서 복구

이 절에서는 이전 절에서 설명하는 실패 시나리오에서 복구하기 위한 절차를 설명합니다. 이들 절차는 적당한 클러스터에서 응용 프로그램을 온라인으로 만듭니다.

  1. Hitachi TrueCopy 장치 그룹 devgroup1을 SMPL 상태에 둡니다.

    pairsplit 명령을 사용하여 cluster-pariscluster-newyork 모두의 보호 그룹에 있는 장치 그룹을 SMPL 상태에 둡니다. 이절 절에서 표시되는 쌍 상태에 대해 다음 pairsplit 명령이 실행되어야 합니다.


    phys-newyork-1# pairsplit -R -g devgroup1
    phys-newyork-1# pairsplit -S -g devgroup1
  2. 클러스터 중 하나를 보호 그룹에 대한 Primary로 만듭니다.

    원래의 1차 클러스터에서 응용 프로그램을 가동하려는 경우 원래 1차 클러스터 cluster-paris를 보호 그룹에 대한 1차로 만듭니다. 응용 프로그램은 원래 1차 클러스터의 현재 데이터를 사용합니다.

    원래 2차 클러스터에서 응용 프로그램을 가동하려는 경우 원래 2차 클러스터 cluster-newyork를 보호 그룹에 대한 1차로 만듭니다. 응용 프로그램은 원래 2차 클러스터의 현재 데이터를 사용합니다.


    주의 – 주의 –

    horctakeover 명령이 스왑 인계를 수행하지 않았기 때문에 cluster-newyork의 데이터 볼륨이 cluster-paris의 데이터 볼류과 동기화되지 않을 수 있습니다. 원래의 1차 클러스터와 동일하게 나타나는 데이터를 사용하여 응용 프로그램을 작동하려는 경우 원래 2차 클러스터를 1차로 만들지 않아야 합니다.


Procedure원래 1차 클러스터를 Hitachi TrueCopy 보호 그룹에 대한 1차로 만드는 방법

단계
  1. 원래 1차 클러스터의 보호 그룹을 비활성화합니다.


    phys-paris-1# geopg stop -e Local tcpg
  2. 보호 그룹의 구성을 재동기화합니다.

    이 명령은 cluster-newyork의 보호 그룹의 구성 정보로 cluster-paris 의 보호 그룹의 구성을 업데이트합니다.


    phys-paris-1# geopg update tcpg

    geopg update 명령이 성공적으로 실행된 후 tcpg는 각 클러스터에서 다음 역할을 갖습니다.


    cluster-paris:
    		tcpg role: Primary
    cluster-newyork:
    		tcpg role: secondary
  3. 파트너쉽의 두 클러스터 모두에서 보호 그룹을 활성화합니다.


    phys-paris-1# geopg start -e Global tcpg

    이 명령은 cluster-paris의 응용 프로그램을 작동시킵니다. cluster-paris에서 cluster-newyork 로 데이터 복제가 시작됩니다.

Procedure원래 2차 클러스터를 Hitachi TrueCopy 보호 그룹에 대한 1차로 만드는 방법

단계
  1. 보호 그룹의 구성을 재동기화합니다.

    이 명령은 cluster-paris의 보호 그룹의 구성 정보로 cluster-newyork의 보호 그룹의 구성을 업데이트합니다.


    phys-newyork-1# geopg update tcpg

    geopg update 명령이 성공적으로 실행된 후 tcpg는 각 클러스터에서 다음 역할을 갖습니다.


    cluster-paris:
    		tcpg role: Secondary
    cluster-newyork:
    		tcpg role: Primary
  2. 파트너쉽의 두 클러스터 모두에서 보호 그룹을 활성화합니다.


    phys-newyork-1# geopg start -e Global tcpg

    이 명령은 cluster-newyork의 응용 프로그램을 작동시킵니다. cluster-newyork에서 cluster-paris로의 데이터 복제가 시작됩니다.


    주의 – 주의 –

    이 명령은 cluster-paris의 데이터를 겹쳐씁니다.


Hitachi TrueCopy 데이터 복제 오류에서 복구

데이터 복제 레벨에서 오류가 발생할 때 오류가 관련 장치 그룹의 복제 자원 그룹의 자원 상태에 반영됩니다.

데이터 복제 오류 검출 방법

데이터 복제 레벨에서 오류가 발생할 때 오류가 관련 장치 그룹의 복제 자원 그룹의 자원 상태에 반영됩니다.

Resource status 값이 실제 복제 쌍 상태에 맵핑될 때의 차이를 보려면 표 10–6을 참조하십시오.

다음과 같이 scstat -g 명령을 사용하여 복제 자원의 상태를 점검할 수 있습니다.


phys-paris-1# scstat -g

scstat -g 명령을 실행하면 다음이 리턴될 수 있습니다.


...

--Resources --
            Resource Name       Node Name           State         Status Message
            -------------       ---------           -----         --------------
Resource: r-tc-tcpg1-devgroup1  phys-paris-2        Offline       Offline
Resource: r-tc-tcpg1-devgroup1  phys-paris-1        Online        Faulted - P-VOL:PSUE

Resource: hasp4nfs              phys-paris-1        Offline       Offline
Resource: hasp4nfs              phys-paris-2        Offline       Offline

...

보호 그룹의 모든 장치 그룹에 대한 총계 자원 상태는 geoadm status 명령을 사용하여 주어집니다. 예를 들어, 앞선 예에서 scstat -g 명령의 결과는 Hitachi TrueCopy 장치 그룹 devgroup1 cluster-paris 에서 PSUE 상태인지 나타냅니다. 표 10–6PSUE 상태가 FAULTED의 자원 상태와 일치하는지 나타냅니다. 따라서 보호 그룹의 데이터 복제 상태도 FAULTED입니다. 이 상태는 geoadm status 명령의 출력에 반영되는데, 보호 그룹의 상태를 Error 로 표시합니다.


phys-paris-1# geoadm status
Cluster: cluster-paris

Partnership "paris-newyork-ps"  : OK
   Partner clusters             : cluster-newyork
   Synchronization              : OK      

   Heartbeat "paris-to-newyork" monitoring "cluster-newyork": OK 
      Heartbeat plug-in "ping_plugin"             : Inactive
      Heartbeat plug-in "icrm_plugin"             : OK
      Heartbeat plug-in "tcp_udp_plugin"          : OK

Protection group "tcpg"   : Error
      Partnership         : paris-newyork-ps
      Synchronization     : OK

      Cluster cluster-paris    : Error
         Role                  : Primary
         PG activation state   : Activated
         Configuration         : OK
         Data replication      : Error
         Resource groups       : OK 
   
      Cluster cluster-newyork  : Error
         Role                  : Secondary
         PG activation state   : Activated
         Configuration         : OK
         Data replication      : Error
         Resource groups       : OK

Pending Operations
      Protection Group         : "tcpg"
      Operations               : start        

ProcedureHitachi TrueCopy 데이터 복제 오류에서 복구하는 방법

오류 상태에서 복구하기 위해 다음 절차의 단계를 모두 또는 일부 수행할 수 있습니다.

단계
  1. Hitachi TrueCopy 문서의 절차를 사용하여 FAULTED 상태의 원인을 판별하십시오. 이 상태는 PSUE로 표시됩니다.

  2. Hitachi TrueCopy 절차를 사용하여 오류 상태에서 복구합니다.

    복구 절차가 장치 그룹의 상태를 변경하는 경우 이 상태는 자원에 의해 자동으로 검출되며 새 보호 그룹 상태로서 보고됩니다.

  3. 보호 그룹 구성을 재검증합니다.


    phys-paris-1# geopg validate protection-group-name 
    
    보호_그룹_이름

    Hitachi TrueCopy 보호 그룹의 이름을 지정합니다.

  4. 보호 그룹 구성의 상태를 검토합니다.


    phys-paris-1# geopg list protection-group-name 
    
    보호_그룹_이름

    Hitachi TrueCopy 보호 그룹의 이름을 지정합니다.

  5. 보호 그룹의 런타임 상태를 검토합니다.


    phys-paris-1# geoadm status