페일오버 및 페일백 동작 검증
VMware vSAN 확장 클러스터가 구성되면 페일오버 및 페일백 워크플로우를 모두 검증하여 비즈니스 연속성 및 재해 복구 준비를 보장해야 합니다. 이 절에서는 기본 사이트에서 실패를 시뮬레이트하고 보조 사이트에서 복구를 테스트한 다음 기본 사이트로 서비스를 복원하는 단계에 대해 설명합니다.
Failover 이벤트 시뮬레이트
Primary Region Failure를 시뮬레이트하려면 다음과 같이 하십시오.
- 기본 영역 호스트 전원 끄기
- OCI 콘솔을 사용하여 기본 리전의 모든 VMware ESXi 호스트를 강제적으로 해제합니다.
- 보조 사이트에서 HA 복구 관찰
- 보조 리전의 배스천 VM에서 VMware ESXi 호스트 중 하나에 연결합니다.
- 관리 및 작업 부하 VM이 VMware vSphere HA를 통해 자동으로 전원을 켭니다.
- 네트워크 경로 지정 업데이트
- 기본 영역의 DRG에서
VCN-MGMT-Active
를 분리합니다. - 보조 영역의 DRG에
VCN-MGMT-Failover
를 연결합니다.
- 기본 영역의 DRG에서
VCN-MGMT-Failover
에서 경로 테이블 수정- 다음 대상으로 지정된 트래픽을 가리키도록 경로 테이블을 업데이트합니다.
10.16.0.0/16
(기본 VCN)10.17.0.0/16
(보조 VCN)172.30.0.0/16
(오버레이 네트워크 또는 외부 리소스)- DRG in the Secondary Region의 약어입니다.
- 다음 대상으로 지정된 트래픽을 가리키도록 경로 테이블을 업데이트합니다.
- 접속 확인
- Network Analyzer 또는 이와 유사한 진단 도구를 사용하여 vSphere 구성 요소에 대한 연결 가능성을 검증합니다.
- vCenter가 작동 중인지 확인하고 Primary Region 호스트를 사용할 수 없는 호스트로 표시합니다.
- 테스트 VM을 사용하여 East-West(내부 사이트) 및 North-South(외부) 연결을 검증합니다.
- 인터넷 액세스가 보조 리전의 NAT 게이트웨이를 통해 예상대로 작동하는지 확인합니다.
최적화된 라우팅 및 구성을 통해 VM은 장애 감지 후 15분 이내에 복구하고 작동할 수 있습니다. 네트워킹 업데이트 및 확인은 일반적으로 추가 5분 내에 완료됩니다.
페일백 실행
기본 영역이 복원되고 작동되면 다음 단계에 따라 서비스를 원래 상태로 되돌립니다.
- 기본 호스트 복원 및 재부트
- 이전에 종료된 VMware ESXi 호스트의 전원을 켭니다.
- 온라인 상태가 되면 OCI 콘솔을 통해 전체 재부팅을 수행하거나 SSH를 통해
services.sh
재시작을 사용하여 시스템 서비스를 수동으로 재시작하여 안정성을 보장합니다.
- vMotion VM을 기본 호스트로 돌아가기
- Secondary Region 호스트에서 Primary Region 호스트로 모든 워크로드 및 관리 VM을 마이그레이션합니다.
주:
이 단계에서 조정되지 않은 경로 지정으로 인해 VM이 일시적으로 네트워크를 차단할 수 있습니다.
- Secondary Region 호스트에서 Primary Region 호스트로 모든 워크로드 및 관리 VM을 마이그레이션합니다.
- 네트워크 경로 지정 재구성
- 보조 영역의 DRG에서
VCN-MGMT-Failover
를 분리합니다. - 기본 영역의 DRG에
VCN-MGMT-Active
를 다시 연결합니다. - 기존 항목이 이전 구성에서 적합하게 유지되므로 경로 테이블을 변경할 필요가 없습니다.
- 보조 영역의 DRG에서
- 운영 상태 확인
- 기본 리전의 배스천에서 VM 및 서비스 접근성을 검증합니다.
- HA, vMotion 및 VMware vSAN 작업이 예상대로 재개되었는지 확인합니다.
- 이제 모든 경로 및 정책에 사전 페일오버 상태가 반영되어야 합니다.
이렇게 해서 페일오버 및 페일백 시나리오의 성공적인 시뮬레이션을 포함하여 OCI Dedicated Region에서 VMware vSAN 확장 클러스터의 구성 및 검증이 완료되었습니다.