Oracle Data Guard Fast-Start Failover에 대해 알아보기

Oracle AI Database@AzureOracle Exadata Database Service on Exascale InfrastructureOracle Exadata Database Service on Dedicated Infrastructure를 사용하여 Azure 데이터 센터에서 미션 크리티컬한 Oracle AI Database 워크로드를 지원합니다.

Oracle Exadata Database MachineOracle Real Application Clusters(Oracle RAC)의 고가용성, 성능 및 확장성이 내장되어 있어 Azure 기반 애플리케이션의 대기 시간이 짧습니다.

다른 가용성 영역 또는 지역에 있는 대기 데이터베이스로 솔루션을 확장하면 데이터 센터 및 지역 정전 시 데이터 보호 및 재해 복구가 가능합니다.

Data Guard는 데이터를 대기 데이터베이스로 동기적으로 전송하여 데이터 손실을 방지합니다. Fast-Start Failover를 사용하면 Broker가 수동 Failover 단계 없이 대상 대기 데이터베이스를 기본 롤로 자동으로 Failover할 수 있습니다.

관찰자 사이트는 Fast-Start Failover 환경을 모니터합니다. Observer는 기본 및 대기 데이터베이스와 다른 컴퓨트 VM에서 실행되고 기본 데이터베이스 가용성을 모니터하는 별도의 클라이언트측 구성요소입니다.

Fast-start failover는 구성 가능한 RTO(복구 시간 목표)를 통해 더 빠른 페일오버를 제공하며, 동기 모드의 데이터 손실이 전혀 없거나 비동기 모드의 RPO(복구 지점 목표)가 제한되어 있습니다.

이 솔루션 플레이북에서는 Data Guard를 구성 및 배포하고 Oracle Exadata Database Service on Exascale Infrastructure를 사용하여 Oracle AI Database@Azure 가용성 영역 전반에서 빠른 시작 페일오버를 활성화하는 방법을 알아봅니다. Oracle Exadata Database Service on Dedicated Infrastructure에도 동일한 솔루션이 적용됩니다.

시작하기 전에

Data Guard 및 Fast-Start Failover를 구성하기 전에 필요 조건을 확인하고 참조를 검토하십시오.

시작하기 전에 다음을 확인하십시오.

  • 엑사스케일 VM 클러스터는 서로 다른 Azure 가용성 영역에 배치됩니다.
  • Oracle AI Database 26ai는 기본 가용성 영역에 생성됩니다.
  • 기본 및 대기 엑사스케일 VM 클러스터에 대한 네트워크 IP CIDR 범위가 겹치지 않습니다.

다음 해결 방법을 검토합니다.

그런 다음 Azure에서 컴퓨팅 VM을 프로비저닝하여 기본 및 대기 데이터베이스와 다른 가용성 영역에서 Observer를 호스트해야 합니다. Observer는 primary database 및 standby database에 연결하는 Oracle 클라이언트로 작동하므로 경량 VM에서 실행할 수 있습니다.

구조

Oracle AI Database는 기본 가용성 영역의 엑사스케일 VM 클러스터에서 실행됩니다. 데이터 보호를 위해 Data Guard는 동일한 영역의 다른 가용성 영역(로컬 대기)에 데이터를 복제합니다.

다음 아키텍처는 다른 가용성 영역에서 실행 중인 관찰자와의 영역 간 Data Guard를 보여줍니다.



cross-zones-dg-oracledb-azure-oracle.zip

Data Guard 트래픽은 Oracle Cloud Infrastructure(OCI) 또는 Azure 네트워크를 통해 라우팅할 수 있습니다. 이 아키텍처는 Data Guard 네트워크 트래픽을 Azure 네트워크를 통해 전달하여 모든 데이터를 Azure 플랫폼 내에 유지합니다. OCI 사이트의 VCN은 기본 및 대기 데이터베이스에 대해 Oracle AI Database@AzureOracle Exadata Database Service on Exascale Infrastructure VM 클러스터가 생성된 후 생성됩니다.

이 구조에서 다음을 수행합니다.

  • 기본 엑사스케일 VM 클러스터는 VNet1의 기본 가용성 영역에 CIDR 10.10.0.0/16 및 위임된 서브넷 CIDR 10.10.1.0/24와 함께 배치됩니다.
  • 대기 엑사스케일 VM 클러스터는 CIDR 10.20.0.0/16 및 위임된 서브넷 CIDR 10.20.1.0/24를 사용하여 VNet2의 대기 가용성 영역에 배치됩니다.
  • Observer는 CIDR 10.30.0.0/16 및 서브넷 CIDR 10.30.1.0/24를 사용하여 VNet3에 배치됩니다.
  • VNet1VNet2와 피어링되어 Data Guard 트래픽이 기본 데이터베이스와 대기 데이터베이스 간에 유입되도록 합니다.
  • VNet3는 관찰자가 두 데이터베이스에 모두 접속할 수 있도록 VNet1VNet2로 피어링됩니다.

이 구조에는 다음과 같은 구성 요소가 있습니다.

  • Azure 리전

    Azure 리전은 가용성 영역이라고 하는 하나 이상의 물리적 Azure 데이터 센터가 상주하는 지리적 영역입니다. 지역은 다른 지역과 독립적이며, 광대한 거리는 (국가 또는 대륙에서) 그들을 분리 할 수 있습니다.

    Azure 및 OCI 리전은 지역화된 지리적 영역입니다. Oracle AI Database@Azure의 경우, Azure 리전이 OCI 리전에 연결되고, Azure의 가용성 영역(AZ)이 OCI의 가용성 도메인(AD)에 연결됩니다. Azure 및 OCI 리전 쌍은 거리 및 대기 시간을 최소화하기 위해 선택됩니다.

  • Azure 가용성 도메인

    Azure Availability Domain, or availability set, is a logical grouping of virtual machines.

  • Azure Virtual Network 및 서브넷

    Azure Virtual Network(VNet)를 사용하면 Azure 리소스를 정의한 논리적으로 격리된 개인 네트워크에 배포할 수 있습니다. 이 네트워크는 기존 온프레미스 네트워크와 비슷하지만 Azure의 확장 가능하고 고가용성 클라우드 인프라의 이점을 누릴 수 있습니다. VNet을 생성한 후에는 이를 하나 이상의 서브넷으로 분할하여 작업 로드에 대한 네트워크 트래픽을 구성하고 제어할 수 있습니다.

  • Azure 위임 서브넷

    위임된 서브넷은 Oracle AI Database@Azure 서비스에 예약 및 위임된 VNet 서브넷으로, Oracle은 프라이빗 네트워크 IP 공간 내에서 필요한 데이터베이스 리소스를 배포하고 관리할 수 있습니다.

  • Azure VNIC(가상 네트워크) 인터페이스 카드

    Azure 데이터 센터의 서비스에는 물리적 NIC(네트워크 인터페이스 카드)가 있습니다. 가상 머신 인스턴스는 물리적 NIC와 연관된 VNIC(가상 NIC)를 사용하여 통신합니다. 각 인스턴스에는 실행 중 자동으로 생성되고 연결되며 인스턴스 수명 동안 사용할 수 있는 기본 VNIC가 있습니다.

  • Microsoft Azure 컴퓨트 VM

    Azure Virtual Machines (VMs) provide on-demand, scalable compute resources that you can use like a physical server or desktop. 운영 체제 및 소프트웨어 환경에 대한 완전한 제어가 필요한 경우 VM을 사용합니다.

    VM은 물리적 하드웨어를 관리해야 하는 필요성을 제거하지만, VM에서 실행 중인 소프트웨어를 구성, 패치 및 관리합니다. 커스텀 및 레거시 워크로드를 지원합니다.

  • OCI 리전

    OCI 리전은 가용성 도메인을 호스팅하는 데이터 센터가 하나 이상 포함된 지역화된 지리적 영역입니다. 지역은 다른 지역과 독립적이며, 광대한 거리는 (국가 또는 대륙에 걸쳐) 그들을 분리 할 수 있습니다.

  • 가용성 도메인

    가용성 도메인은 한 지역 내의 독립형 독립형 데이터 센터입니다. 각 가용성 도메인의 물리적 리소스는 결함 허용을 제공하는 다른 가용성 도메인의 리소스와 격리됩니다. 가용성 도메인은 전원 또는 냉각과 같은 인프라나 내부 가용성 도메인 네트워크를 공유하지 않습니다. 따라서 한 가용성 도메인의 장애가 해당 지역의 다른 가용성 도메인에 영향을 미치지 않아야 합니다.

  • OCI 가상 클라우드 네트워크 및 서브넷

    VCN(가상 클라우드 네트워크)은 OCI 리전에 설정하는 커스터마이징 가능한 소프트웨어 정의 네트워크입니다. 기존 데이터 센터 네트워크와 마찬가지로 VCN을 사용하면 네트워크 환경을 제어할 수 있습니다. VCN에는 VCN을 생성한 후 변경할 수 있는 겹치지 않는 CIDR(클래스리스 도메인 간 경로 지정) 블록이 여러 개 있을 수 있습니다. VCN을 서브넷으로 분할할 수 있으며, 이 서브넷은 지역 또는 가용성 도메인으로 범위가 지정될 수 있습니다. 각 서브넷은 VCN의 다른 서브넷과 겹치지 않는 연속적인 주소 범위로 구성됩니다. 썸네일의 크기는 생성 이후 변경할 수 있습니다. 서브넷은 공용 또는 전용일 수 있습니다.

  • NSG(네트워크 보안 그룹)

    NSG는 클라우드 리소스의 가상 방화벽 역할을 합니다. OCI의 제로 트러스트 보안 모델을 사용하면 VCN 내의 네트워크 트래픽을 제어할 수 있습니다. NSG는 단일 VCN의 지정된 VNIC(가상 네트워크 인터페이스 카드) 세트에만 적용되는 수신 및 송신 보안 규칙 세트로 구성됩니다.

  • Oracle Data Guard

    Oracle Data Guard and Active Data Guard provide a comprehensive set of services that create, maintain, manage, and monitor one or more standby databases and that enable production Oracle databases to remain available without interruption. Oracle Data Guard는 인메모리 복제를 사용하여 이러한 대기 데이터베이스를 운용 데이터베이스의 복사본으로 유지 관리합니다. 계획된 운용중단 또는 계획되지 않은 운용중단으로 인해 운용 데이터베이스를 사용할 수 없게 되면 Oracle Data Guard는 모든 대기 데이터베이스를 운용 롤로 전환하여 운용중단과 연관된 작동 중지 시간을 최소화할 수 있습니다. Oracle Active Data Guard는 대부분 읽기 워크로드를 대기 데이터베이스로 오프로드하는 추가 기능을 제공하며 고급 데이터 보호 기능도 제공합니다.

  • Oracle AI Database@Azure

    Oracle AI Database@Azure는 Microsoft Azure 데이터 센터에 배포된 OCI에서 실행되는 Oracle Database 서비스(Oracle Exadata Database Service on Dedicated InfrastructureOracle Autonomous AI Database Serverless)입니다. 이 서비스는 OCI와의 기능 및 가격 패리티를 제공합니다. Azure Marketplace에서 서비스를 구매하세요.

    Oracle AI Database@AzureOracle Exadata Database Service, Oracle Real Application Clusters(Oracle RAC), Oracle Data Guard 기술을 Azure 플랫폼에 통합합니다. 사용자는 Azure 콘솔 및 Azure 자동화 도구에서 서비스를 관리합니다. 이 서비스는 Azure Virtual Network(VNet)에 배포되고 Azure ID 및 액세스 관리 시스템과 통합됩니다. OCI 및 Oracle AI Database의 일반 메트릭 및 감사 로그는 기본적으로 Azure에서 사용할 수 있습니다. 이 서비스를 사용하려면 사용자에게 Azure 구독 및 OCI 테넌시가 있어야 합니다.

    자율운영 AI 데이터베이스는 Oracle Exadata 인프라를 기반으로 구축되었으며, 자가 관리, 자가 보안 및 자가 복구 기능을 갖추고 있어 수동 데이터베이스 관리 및 인적 오류를 제거합니다. 자율운영 AI 데이터베이스는 사용자가 선택한 대규모 언어 모델(LLM) 및 배포 위치를 사용하여 내장된 AI 기능을 사용하여 모든 데이터로 확장 가능한 AI 기반 앱을 개발할 수 있게 해줍니다.

    Oracle Exadata Database ServiceOracle Autonomous AI Database Serverless는 모두 네이티브 Azure 포털을 통해 손쉽게 프로비저닝되므로 보다 광범위한 Azure 생태계에 액세스할 수 있습니다.

권장사항

Oracle AI Database@Azure에서 Oracle Exadata Database Service on Exascale Infrastructure에 대해 Fast-Start Failover를 사용으로 설정할 때 다음 권장 사항을 시작점으로 사용합니다.

요구 사항은 여기에 설명된 아키텍처와 다를 수 있습니다.

  • 관찰자를 별도의 세번째 사이트의 호스트에 배치합니다. 따라서 기본 또는 대기 사이트가 완전히 실패할 경우 관찰자가 활성 상태로 유지되어 페일오버를 조정하거나 나머지 사이트를 모니터할 수 있습니다.
  • 사용 가능한 세번째 사이트가 없는 경우 기본 사이트에 관찰자를 배치합니다.
  • 고가용성을 위해 여러 서버에서 여러 관찰자를 구성합니다. 하나의 관찰자만 기본 관찰자가 될 수 있지만 추가 관찰자는 백업 관찰자 역할을 합니다.
  • Oracle 설명서에 따라 Fast-Start Failover 등록 정보(예: FastStartFailoverThreshold, FastStartFailoverLagLimitFastStartFailoverAutoReinstate)와 같은 Fast-Start Failover 구성 등록 정보에 대한 값을 설정합니다.
  • Data Guard 구성 내에서 Oracle AI Database 홈과 동일한 주 릴리스 및 패치 레벨(릴리스 업데이트 [RU] 포함)을 사용하여 항상 Data Guard Broker Observer를 실행하십시오. 이 조합은 가장 철저한 테스트를 거쳐 운영 위험을 최소화합니다. 또한 클라이언트측(관찰자) 및 서버측(데이터베이스) 코드 모두에 영향을 주는 모든 수정 사항이 언제든지 적용됩니다. Observer와 데이터베이스 간의 최대 하나의 주요 LTS(장기 지원 릴리스) 차이는 주로 롤링 업그레이드를 용이하게 하고 작동 중지 시간을 최소화하기 위해 허용됩니다. 예를 들어, 26ai의 Observer(업그레이드 절차 중 Database는 19c로, 반대의 경우도 마찬가지임)

고려사항

Oracle AI Database@Azure에서 Oracle Exadata Database Service on Exascale Infrastructure에 대해 Fast-Start Failover를 사용으로 설정할 때 다음 사항을 고려하십시오.
  • 절대 Observer를 standby database와 동일한 사이트에 배치하지 마십시오. standby site가 다운되면 observer와 통신할 수 없기 때문에 primary site도 종료되어 완전한 중단을 초래합니다.
  • Observer는 경량 VM에서 실행할 수 있습니다. 그러나 primary database와 standby database에 대한 네트워크 연결 안정성은 적절한 작업을 보장하고 불필요한 failover를 방지하는 데 중요합니다.
  • 데이터 손실이 없도록 Data Guard 최대 가용성 모드를 구성합니다. 데이터 손실을 최소화하는 것보다 primary database의 성능에 대해 더 우려되는 경우 구성 보호 모드가 최대 성능으로 설정된 경우 fast-start failover를 활성화하는 것이 좋습니다.
  • 복구 시간은 대상 대기 데이터베이스가 기본 데이터베이스에서 수신한 모든 리두 데이터를 적용했는지 여부에 따라 달라집니다. Fast-Start Failover는 Recovery를 최적화하는 단계를 수행하면 기본 데이터베이스의 리두 적용률에 따라 리두 데이터를 Standby Database에 적용하여 최신 상태로 유지되도록 할 때 더 빠릅니다. Data GuardBroker Concepts 설명서에서 Performance Considerations for Fast-Start Failover 절을 참조하십시오.

  • 복구 시간은 대기 데이터베이스의 리두 적용 상태에 따라 다릅니다.

필수 서비스 및 역할 정보

대기 데이터베이스를 생성하고 Fast-Start Failover를 위한 네트워킹을 관리하는 데 필요한 서비스와 롤을 검토합니다.

이 솔루션에는 다음 서비스 및 역할이 필요합니다.

  • 엑사스케일 인프라의 Oracle Exadata Database Service
  • Oracle Cloud Infrastructure Networking

각 서비스에 필요한 역할입니다.

서비스 이름: 역할 필수 항목...
OCI 데이터베이스: manage database-family Data Guard 대기 데이터베이스 생성
OCI 네트워킹: manage vcn-family OCI에서 네트워크 보안 그룹 관리

필요한 정보를 얻으려면 Oracle 제품, 솔루션 및 서비스를 참조하십시오.