Sun Cluster Geographic Edition 시스템 관리 설명서

8장 Sun StorEdge Availability Suite 3.2.1 데이터 복제를 사용하는 서비스 마이그레이션

이 장에서는 유지보수용 또는 클러스터 장애의 결과로 인한 서비스 마이그레이션에 대한 정보를 제공합니다. 이 장은 다음 내용으로 구성되어 있습니다.

Sun StorEdge Availability Suite 3.2.1 데이터 복제를 사용하는 시스템의 클러스터 실패 검출

이 절에서는 1차 또는 2차 클러스터에서 실패가 검출될 때 발생하는 내부 프로세스에 대해 설명합니다.

1차 클러스터 실패 검출

주어진 보호 그룹에 대한 1차 클러스터가 실패하면 파트너쉽의 2차 클러스터가 실패를 검출합니다. 실패하는 클러스터가 둘 이상의 파트너쉽의 구성원일 수 있으며, 이 경우 복수 실패 검출이 발생합니다.

보호 그룹의 전체 상태가 Unknown 상태로 변경될 때 다음 조치가 발생합니다.

2차 클러스터 실패 검출

어진 보호 그룹에 대한 2차 클러스터가 실패하면 동일한 파트너쉽의 클러스터가 실패를 검출합니다. 실패한 클러스터가 둘 이상의 파트너쉽의 구성원일 수 있으며, 이 경우 복수 실패 검출이 발생합니다.

실패 검출 중에 다음 조치가 발생합니다.

작업 전환으로 Sun StorEdge Availability Suite 3.2.1을(를) 사용하는 서비스 마이그레이션

파트너 클러스터로 서비스를 순차적으로 이전하려는 경우 Sun StorEdge Availability Suite 3.2.1 보호 그룹의 작업 전환을 수행합니다. 작업 전환은 다음으로 구성됩니다.

Procedure1차에서 2차로 Sun StorEdge Availability Suite 3.2.1 보호 그룹을 작업 전환하는 방법

시작하기 전에

작업 전환이 발생하려면 1차 클러스터와 2차 클러스터 사이에 데이터 복제가 활성 상태여야 합니다. 또한 두 클러스터의 데이터 볼륨이 동기된 상태에 있어야 합니다.

보호 그룹을 1차 클러스터에서 2차 클러스터로 작업 전환하기 전에 다음 조건이 만족되는지 확인하십시오.

단계
  1. 클러스터 노드 중 하나에 로그인합니다.

    이 절차를 완료하려면 Geo Management RBAC 권리 프로파일이 지정되어야 합니다. RBAC에 대한 자세한 정보는 Sun Cluster Geographic Edition 소프트웨어와 RBAC를 참조하십시오.

  2. 작업 전환을 시작합니다.

    보호 그룹의 일부인 응용 프로그램 자원 그룹이 작업 전환 중에 정지되고 시작됩니다.


    # geopg  switchover [-f] -m new-primary-cluster protection-group-name 
    
    -f

    사용자에게 확인을 요청하지 않고 강제로 명령이 조작을 수행하도록 합니다.

    -m new-primary-cluster

    보호 그룹에 대한 1차 클러스터가 될 클러스터의 이름을 지정합니다.

    protection-group-name

    보호 그룹의 이름을 지정합니다.


예 8–1 1차에서 2차로 강제 작업 전환

다음 예는 2차 클러스터로 작업 전환을 수행하는 방법을 보여줍니다.


# geopg switchover -f -m cluster-newyork avspg

작업 전환 동안 Sun Cluster Geographic Edition 소프트웨어가 수행하는 조치

geopg switchover 명령이 실행될 때 소프트웨어는 장치 그룹과 연관된 볼륨 세트가 replicating 상태에 있는지 확인합니다. 그런 다음 소프트웨어는 원래 1차 클러스터에 다음 조치를 수행합니다.

원래 2차 클러스터에서 명령은 다음 조치를 수행합니다.

명령이 성공적으로 실행하는 경우 2차 클러스터 cluster-newyork 이 보호 그룹에 대한 새 1차 클러스터가 됩니다. 원래 1차 클러스터인 cluster-paris는 새 2차 클러스터가 됩니다. 보호 그룹의 장치 그룹과 연관된 볼륨 세트는 로컬 클러스터의 보호 그룹 역할에 따라서 해당 역할이 반전되었습니다. 응용 프로그램 자원 그룹이 새 1차 클러스터에서 온라인입니다. 새 1차 클러스터에서 새 2차 클러스터로의 데이터 복제가 시작됩니다.

앞의 조작 중 하나라도 실패하는 경우 이 명령은 오류를 리턴합니다. 각 구성요소의 상태를 보려면 geoadm status 명령을 실행하십시오. 예를 들어 보호 그룹의 Configuration 상태가 실패의 원인에 따라서 Error로 설정될 수 있습니다. 보호 그룹이 활성화 또는 비활성화될 수 있습니다.

보호 그룹의 Configuration 상태가 Error로 설정되는 경우, Sun StorEdge Availability Suite 3.2.1 보호 그룹 검증 방법에서 설명하는 절차를 사용하여 보호 그룹을 재검증하십시오.

보호 그룹의 구성이 각 파트너 클러스터에서 같지 않은 경우 Sun StorEdge Availability Suite 3.2.1 보호 그룹 재동기화 방법 에서 설명하는 절차를 사용하여 구성을 재동기화해야 합니다.

Sun StorEdge Availability Suite 3.2.1을 사용하는 시스템에서 강제 작업 인계

1차 볼륨과 2차 볼륨의 데이터가 완전히 일치하는지 여부와 상관없이 응용 프로그램이 2차 클러스터에서 온라인으로 되어야 할 때 작업 인계를 수행해야 합니다. 작업 인계가 시작될 때 다음 단계가 발생합니다.

작업 인계 전후에 1차 및 2차 클러스터의 가능한 조건에 대한 세부사항은 부록 C, 작업 인계 사후 조건을 참조하십시오.

다음 절차는 2차 클러스터에 의한 작업 인계를 강제하기 위해 수행해야 하는 단계 및 그 이후의 데이터 복구 방법을 설명합니다.

Procedure2차 클러스터에 의한 Sun StorEdge Availability Suite 3.2.1 서비스의 즉시 작업 인계 강제 수행 방법

시작하기 전에

2차 클러스터가 1차 클러스터의 활동을 가정하게 하려면 다음 조건이 만족되었는지 확인하십시오.

단계
  1. 2차 클러스터의 노드에 로그인합니다.

    이 절차를 완료하려면 Geo Management RBAC 권리 프로파일이 지정되어야 합니다. RBAC에 대한 자세한 정보는 Sun Cluster Geographic Edition 소프트웨어와 RBAC를 참조하십시오.

  2. 작업 인계를 시작합니다.


    # geopg takeover  [-f] protection-group-name
    
    -f

    사용자 확인 없이 강제로 명령이 조작을 수행하도록 합니다.

    protection-group-name

    보호 그룹의 이름을 지정합니다.


예 8–2 2차 클러스터에 의한 작업 인계 강제 수행

다음 예제는 2차 클러스터 cluster-newyork에 의한 avspg의 작업 인계를 강제로 수행하는 방법을 보여줍니다.

phys-newyork-1은 2차 클러스터의 첫 번째 노드입니다. 어떤 클러스터가 phys-newyork-1인지 다시 보려면 Sun Cluster Geographic Edition 클러스터 구성 예를 참조하십시오.


phys-newyork-1# geopg takeover -f avspg

작업 인계 동안 Sun Cluster Geographic Edition 소프트웨어가 수행하는 조치

geopg takeover 명령이 실행될 때 소프트웨어는 볼륨 세트가 2차 클러스터에서 Replicating 또는 Logging 상태에 있는지 확인합니다.

원래의 1차 클러스터 cluster-paris에 접근할 수 있는 경우 소프트웨어는 다음 조치를 수행합니다.

소프트웨어가 원래의 2차 클러스터 cluster-newyork에서 다음 조치를 수행합니다.

명령이 성공적으로 실행하는 경우 2차 클러스터 cluster-newyork 이 보호 그룹에 대한 새 1차 클러스터가 됩니다. 보호 그룹의 장치 그룹과 연관된 볼륨 세트는 로컬 클러스터의 보호 그룹 역할에 따라서 해당 역할이 반전되었습니다. 보호 그룹이 작업 인계 전에 원래의 2차 클러스터에서 활성이었던 경우 응용 프로그램 자원 그룹이 새 1차 클러스터에서 온라인이 됩니다. 원래의 1차 클러스터에 접근할 수 있는 경우 보호 그룹의 새 2차 클러스터가 됩니다. 보호 그룹의 장치 그룹과 연관된 모든 볼륨 세트의 복제가 정지됩니다.


주의 – 주의 –

작업 인계에 성공한 후 데이터 복제가 정지됩니다. 복제를 계속 일시중단하려는 경우 geopg start 명령을 사용할 때마다 -n 옵션을 지정하십시오. 이 옵션은 새 1차 클러스터에서 새 2차 클러스터로 데이터 복제가 시작되지 않도록 합니다.


앞의 조작 중 하나라도 실패하는 경우 이 명령은 오류를 리턴합니다. 각 구성요소의 상태를 보려면 geoadm status 명령을 실행하십시오. 예를 들어 보호 그룹의 Configuration 상태가 실패의 원인에 따라서 Error로 설정될 수 있습니다. 보호 그룹이 활성화 또는 비활성화될 수 있습니다.

보호 그룹의 Configuration 상태가 Error로 설정되는 경우, Sun StorEdge Availability Suite 3.2.1 보호 그룹 검증 방법에서 설명하는 절차를 사용하여 보호 그룹을 재검증하십시오.

보호 그룹의 구성이 각 파트너 클러스터에서 같지 않은 경우 Sun StorEdge Availability Suite 3.2.1 보호 그룹 재동기화 방법 에서 설명하는 절차를 사용하여 구성을 재동기화해야 합니다.

작업 인계 후 Sun StorEdge Availability Suite 3.2.1 데이터 복구

작업 인계 조작이 성공한 후에는 2차 클러스터(cluster-newyork )가 보호 그룹에 대한 1차 클러스터가 되고 서비스가 2차 클러스터에서 온라인 됩니다. 원래의 1차 클러스터가 복구된 후에 서비스가 장애 복구라는 프로세스를 사용하여 원래 1차 클러스터에서 다시 온라인이 될 수 있습니다.

Sun Cluster Geographic Edition 소프트웨어는 다음 두 종류의 장애 복구를 지원합니다.

ProcedureSun StorEdge Availability Suite 3.2.1 복제를 사용하는 시스템에서 장애 복구-작업 전환을 수행하는 방법

이 클러스터의 데이터가 현재의 1차 클러스터 cluster-newyork의 데이터와 재동기화된 후, 이 절차를 사용하여 원래의 1차 클러스터 cluster-paris에서 응용 프로그램을 다시 시작하십시오.

시작하기 전에

장애 복구-작업 전환을 수행하기 전에 작업 인계가 cluster-newyork에서 발생했습니다. 클러스터는 이제 다음 역할을 갖습니다.

단계
  1. 원래의 1차 클러스터인 cluster-paris 를 현재의 1차 클러스터인 cluster-newyork와 재동기화합니다.

    cluster-paris는 고유 구성을 상실하고 cluster-newyork 구성을 지역적으로 복제합니다. 파트너쉽 및 보호 그룹 구성을 재동기화합니다.

    1. cluster-paris에서 로컬 클러스터의 보호 그룹을 비활성화합니다.


      # geopg stop -e Local  보호그룹이름
      
      -e Local

      명령의 범위를 지정합니다.

      local 범위를 지정하면 명령이 로컬 클러스터에서만 작동합니다.

      protection-group-name

      보호 그룹의 이름을 지정합니다.

      보호 그룹이 이미 비활성화된 경우, 보호 그룹의 자원 그룹 상태는 Error일 수도 있습니다. 응용프로그램 자원 그룹이 관리되고 오프라인이기 때문에 해당 상태는 Error입니다.

      보호 그룹 비활성화로 인해 Error 상태를 지워서 응용프로그램 자원 그룹을 더 이상 관리하지 않습니다.

    2. cluster-paris에서, 파트너쉽을 재동기화합니다.


      # geops update partnership-name
      
      partnership-name

      파트너쉽의 이름을 지정합니다.


      주 –

      복수 보호 그룹에 대해 장애 복구-작업 전환을 수행 중인 경우에도 이 단계를 한 번만 수행해야 합니다.


      파트너쉽 동기화에 대한 자세한 정보는 파트너쉽 재동기화를 참조하십시오.

    3. cluster-paris에서 각 보호 그룹을 재동기화합니다.

      cluster-newyork 의 보호 그룹 역할이 primary이기 때문에 이 단계에서는 cluster-paris의 보호 그룹 역할이 secondary 임을 확인합니다.


      # geopg update protection-group-name 
      
      protection-group-name

      보호 그룹의 이름을 지정합니다.

      보호 그룹 동기화에 대한 자세한 정보는 Sun StorEdge Availability Suite 3.2.1 보호 그룹 재동기화를 참조하십시오.

  2. cluster-paris에서 각 보호 그룹에 대한 클러스터의 구성을 검증합니다.


    # geopg validate 보호그룹이름 
    
    protection-group-name

    단일 보호 그룹을 식별하는 고유한 이름을 지정합니다.

    자세한 정보는 Sun StorEdge Availability Suite 3.2.1 보호 그룹 검증 방법을 참조하십시오.

  3. cluster-paris에서 각 보호 그룹을 활성화합니다.

    보호 그룹을 활성화할 때 그의 응용 프로그램 자원 그룹도 온라인이 됩니다.


    # geopg start -e Global 보호그룹이름
    
    -e Global

    명령의 범위를 지정합니다.

    Global 범위를 지정하여 보호 그룹이 전개된 양 클러스터에서 해당 명령이 작동합니다.

    protection-group-name

    보호 그룹의 이름을 지정합니다.


    주 –

    -n 옵션은 데이터가 현재 1차인 cluster-newyork에서 현재 2차인 cluster-paris로 동기화되어야 하기 때문에 장애 복구 전환을 수행할 때 제공되어서는 안됩니다.


    보호 그룹에 2차의 역할이 있기 때문에 데이터가 현재 1차인 cluster-newyork에서 현재 2차인 cluster-paris로 동기화됩니다.

    geopg start 명령에 대한 자세한 정보는 Sun StorEdge Availability Suite 3.2.1 보호 그룹 활성화 방법을 참조하십시오.

  4. 데이터가 완전히 동기화되었는지 확인합니다.

    먼저 cluster-newyork 의 보호 그룹 상태가 OK인지 확인합니다.


    phys-newyork-1# geoadm status

    출력의 Protection Group섹션을 참조하십시오.

    다음은 복제 자원 그룹의 모든 자원인 AVS-protection-group-name-rep-rg 의 상태가 OK인지 확인합니다.


    phys-newyork-1# scstat -g
  5. 클러스터 중 하나에서 각 보호 그룹에 대해 cluster-newyork 에서 cluster-paris로의 작업 전환을 수행합니다.


    # geopg  switchover [-f] -m cluster-paris protection-group-name
    

    자세한 정보는 1차에서 2차로 Sun StorEdge Availability Suite 3.2.1 보호 그룹을 작업 전환하는 방법을 참조하십시오.

    cluster-paris가 보호 그룹에 대한 1차 클러스터로서 원래 역할을 재개합니다.

  6. 복제 자원 및 응용프로그램 자원 그룹 및 자원이 온라인 상태인지 확인하려면 각 클러스터에서 geoadm status를 사용하여 전환이 성공적으로 수행되었는지 확인하십시오.

    또한 보호 그룹이 cluster-paris에서 1차이고 cluster-newyork 에서 2차이며 “데이터 복제” 및 “자원 그룹”이 양 클러스터에 대해OK 상태인지 확인해야 합니다.


    # geoadm status

ProcedureSun StorEdge Availability Suite 3.2.1 복제를 사용하는 시스템에서 장애 복구-작업 인계를 수행하는 방법

원래의 1차 클러스터 cluster-paris에서 응용 프로그램을 재시작하고 원래 1차 클러스터의 현재 데이터를 사용하려면 이 절차를 사용하십시오. 2차 클러스터 cluster-newyork가 1차 클러스터로서 활동하고 있는 동안 이 클러스터에서 발생한 모든 업데이트가 삭제됩니다.


주 –

조건에 따라, 원래의 1차 클러스터 cluster-paris의 데이터 사용을 재개할 수 있습니다. cluster-newyork 에 대한 작업 인계 조작 후 임의의 지점에서 새로운 1차 클러스터 cluster-newyork에서 원래의 1차 클러스터 cluster-paris 로 데이터를 복제하지 않아야 합니다.


시작하기 전에

장애 복구-작업 인계 조작을 시작하기 전에 클러스터는 다음 역할을 갖습니다.

단계
  1. 원래의 1차 클러스터 cluster-paris를 원래의 2차 클러스터 cluster-newyork와 재동기화하십시오.

    cluster-paris는 고유 구성을 상실하고 cluster-newyork 구성을 지역적으로 복제합니다.

    1. cluster-paris에서, 파트너쉽을 재동기화합니다.


      # geops update partnership-name
      
      partnership-name

      파트너쉽의 이름을 지정합니다.


      주 –

      복수 보호 그룹에 대해 장애 복구-작업 인계를 수행 중인 경우에도 이 단계를 한 번만 수행해야 합니다.


      파트너쉽 동기화에 대한 자세한 정보는 파트너쉽 재동기화를 참조하십시오.

    2. cluster-paris에서 각 보호 그룹을 재동기화합니다.

      보호 그룹이 활성화되면 geopg stop 명령을 사용하여 보호 그룹을 비활성화합니다. 보호 그룹 비활성화에 대한 자세한 정보는 Sun StorEdge Availability Suite 3.2.1 보호 그룹 비활성화 방법을 참조하십시오.


      # geopg update protection-group-name
      
      protection-group-name

      보호 그룹의 이름을 지정합니다.

      보호 그룹 동기화에 대한 자세한 정보는 Sun StorEdge Availability Suite 3.2.1 보호 그룹 재동기화 방법 을 참조하십시오.

  2. cluster-paris에서 각 보호 그룹에 대한 클러스터의 구성을 검증합니다.


    # geopg validate protection-group-name 
    
    protection-group-name

    단일 보호 그룹을 식별하는 고유한 이름을 지정합니다.

    자세한 정보는 Sun StorEdge Availability Suite 3.2.1 보호 그룹 검증 방법을 참조하십시오.

  3. cluster-paris에서, 데이터 복제 없이 2차 역할의 각 보호 그룹을 활성화합니다.

    cluster-paris의 보호 그룹이 secondary의 역할을 갖기 때문에 geopg start 명령이 cluster-paris에서 응용 프로그램을 재시작하지 않습니다.


    # geopg start -e local -n protection-group-name
    
    -e local

    명령의 범위를 지정합니다.

    local 범위를 지정하면 명령이 로컬 클러스터에서만 작동합니다.

    -n

    보호 그룹 시작 시에 데이터 복제의 시작을 막습니다.


    주 –

    -n 옵션을 사용해야 합니다.


    protection-group-name

    보호 그룹의 이름을 지정합니다.

    자세한 정보는 Sun StorEdge Availability Suite 3.2.1 보호 그룹 활성화 방법을 참조하십시오.

    -n 옵션이 cluster-paris에서 주어지기 때문에 cluster-newyork에서 cluster-paris로의 복제가 시작되지 않습니다.

  4. cluster-paris에서, 각 보호 그룹에 대한 작업 인계를 시작합니다.


    # geopg takeover  [-f] protection-group-name
    
    -f

    사용자 확인 없이 강제로 명령이 조작을 수행하도록 합니다.

    protection-group-name

    보호 그룹의 이름을 지정합니다.

    geopg takeover 명령에 대한 자세한 정보는 2차 클러스터에 의한 Sun StorEdge Availability Suite 3.2.1 서비스의 즉시 작업 인계 강제 수행 방법을 참조하십시오.

    이제 cluster-paris의 보호 그룹은 primary 역할을 갖고, cluster-newyork의 보호 그룹은 secondary 역할을 갖습니다.

  5. cluster-newyork에서 각 보호 그룹을 활성화합니다.

    cluster-newyork 의 보호 그룹이 secondary의 역할을 갖기 때문에, geopg start 명령이 cluster-newyork에서 응용 프로그램을 재시작하지 않습니다.


    # geopg start -e local [-n] protection-group-name
    
    -e local

    명령의 범위를 지정합니다.

    local 범위를 지정하면 명령이 로컬 클러스터에서만 작동합니다.

    -n

    보호 그룹 시작 시에 데이터 복제의 시작을 막습니다.

    이 옵션을 생략하면 데이터 복제 서브시스템이 보호 그룹과 동시에 시작합니다.

    protection-group-name

    보호 그룹의 이름을 지정합니다.

    geopg start 명령에 대한 자세한 정보는 Sun StorEdge Availability Suite 3.2.1 보호 그룹 활성화 방법을 참조하십시오.

  6. 데이터 복제를 시작합니다.

    데이터 복제를 시작하려면 1차 클러스터 cluster-paris에서 보호 그룹을 활성화합니다.


    # geopg start -e local protection-group-name
    

    geopg start 명령에 대한 자세한 정보는 Sun StorEdge Availability Suite 3.2.1 보호 그룹 활성화 방법을 참조하십시오.

Sun StorEdge Availability Suite 3.2.1 데이터 복제 오류에서 복구

데이터 복제 레벨에서 오류가 발생할 때 오류가 관련 장치 그룹의 복제 자원 그룹의 자원 상태에 반영됩니다.

예를 들어 Sun StorEdge Availability Suite 3.2.1에 의해 제어되는 avsdg라는 장치 그룹이 볼륨 실패 상태인 VF로 변경된다고 가정합니다. 이 상태가 다음 자원 상태에서 반영됩니다.


Resource Status = "FAULTED"
Resource status message = "FAULTED : Volume failed"

주 –

검사가 여전히 올바르게 실행 중이기 때문에 자원 상태가 여전히 Online입니다.


자원 상태가 변했기 때문에 보호 그룹 상태도 변경됩니다. 이 경우에 로컬 데이터 복제 상태, 로컬 클러스터의 보호 그룹 상태 및 전체 보호 그룹 상태가 Error가 됩니다.

오류 상태에서 복구하려면 다음 절차의 관련 단계를 완료합니다.

Procedure데이터 복제 오류에서 복구하는 방법

단계
  1. Sun StorEdge Availability Suite 3.2.1 문서의 절차를 사용하여 오류 상태의 원인을 판별하십시오. 이 상태는 VF로 표시됩니다.

  2. Sun StorEdge Availability Suite 3.2.1 절차를 사용하여 오류 상태에서 복구합니다.

    복구 절차가 장치 그룹의 상태를 변경하는 경우 이 상태는 자원에 의해 자동으로 검출되며 새 보호 그룹 상태로서 보고됩니다.

  3. 보호 그룹 구성을 재검증합니다.


    phys-paris-1# geopg validate protection-group-name 
    
    protection-group-name

    Sun StorEdge Availability Suite 3.2.1 보호 그룹의 이름을 지정합니다.

  4. 보호 그룹 구성의 상태를 검토합니다.


    phys-paris-1# geopg list protection-group-name 
    
    protection-group-name

    Sun StorEdge Availability Suite 3.2.1 보호 그룹의 이름을 지정합니다.