페일오버 및 페일백 동작 검증

VMware vSAN 확장 클러스터가 구성되면 페일오버 및 페일백 워크플로우를 모두 검증하여 비즈니스 연속성 및 재해 복구 준비를 보장해야 합니다. 이 절에서는 기본 사이트에서 실패를 시뮬레이트하고 보조 사이트에서 복구를 테스트한 다음 기본 사이트로 서비스를 복원하는 단계에 대해 설명합니다.

Failover 이벤트 시뮬레이트

Primary Region Failure를 시뮬레이트하려면 다음과 같이 하십시오.

기본 영역 호스트 전원 끄기
- OCI 콘솔을 사용하여 기본 리전의 모든 VMware ESXi 호스트를 강제적으로 해제합니다.
보조 사이트에서 HA 복구 관찰
- 보조 리전의 배스천 VM에서 VMware ESXi 호스트 중 하나에 연결합니다.
- 관리 및 작업 부하 VM이 VMware vSphere HA를 통해 자동으로 전원을 켭니다.
네트워크 경로 지정 업데이트
- 기본 영역의 DRG에서 VCN-MGMT-Active를 분리합니다.
- 보조 영역의 DRG에 VCN-MGMT-Failover를 연결합니다.
VCN-MGMT-Failover에서 경로 테이블 수정
- 다음 대상으로 지정된 트래픽을 가리키도록 경로 테이블을 업데이트합니다.
  - 10.16.0.0/16(기본 VCN)
  - 10.17.0.0/16(보조 VCN)
  - 172.30.0.0/16(오버레이 네트워크 또는 외부 리소스)
  - DRG in the Secondary Region의 약어입니다.
접속 확인
- Network Analyzer 또는 이와 유사한 진단 도구를 사용하여 vSphere 구성 요소에 대한 연결 가능성을 검증합니다.
- vCenter가 작동 중인지 확인하고 Primary Region 호스트를 사용할 수 없는 호스트로 표시합니다.
- 테스트 VM을 사용하여 East-West(내부 사이트) 및 North-South(외부) 연결을 검증합니다.
- 인터넷 액세스가 보조 리전의 NAT 게이트웨이를 통해 예상대로 작동하는지 확인합니다.
최적화된 라우팅 및 구성을 통해 VM은 장애 감지 후 15분 이내에 복구하고 작동할 수 있습니다. 네트워킹 업데이트 및 확인은 일반적으로 추가 5분 내에 완료됩니다.

페일백 실행

기본 영역이 복원되고 작동되면 다음 단계에 따라 서비스를 원래 상태로 되돌립니다.

기본 호스트 복원 및 재부트
- 이전에 종료된 VMware ESXi 호스트의 전원을 켭니다.
- 온라인 상태가 되면 OCI 콘솔을 통해 전체 재부팅을 수행하거나 SSH를 통해 services.sh 재시작을 사용하여 시스템 서비스를 수동으로 재시작하여 안정성을 보장합니다.
vMotion VM을 기본 호스트로 돌아가기
- Secondary Region 호스트에서 Primary Region 호스트로 모든 워크로드 및 관리 VM을 마이그레이션합니다.
  
  주:
  이 단계에서 조정되지 않은 경로 지정으로 인해 VM이 일시적으로 네트워크를 차단할 수 있습니다.
네트워크 경로 지정 재구성
- 보조 영역의 DRG에서 VCN-MGMT-Failover를 분리합니다.
- 기본 영역의 DRG에 VCN-MGMT-Active를 다시 연결합니다.
- 기존 항목이 이전 구성에서 적합하게 유지되므로 경로 테이블을 변경할 필요가 없습니다.
운영 상태 확인
- 기본 리전의 배스천에서 VM 및 서비스 접근성을 검증합니다.
- HA, vMotion 및 VMware vSAN 작업이 예상대로 재개되었는지 확인합니다.
- 이제 모든 경로 및 정책에 사전 페일오버 상태가 반영되어야 합니다.

이렇게 해서 페일오버 및 페일백 시나리오의 성공적인 시뮬레이션을 포함하여 OCI Dedicated Region에서 VMware vSAN 확장 클러스터의 구성 및 검증이 완료되었습니다.