Projetar uma topologia de recuperação de desastres (DR) Piloto-Light
Se uma interrupção em larga escala afetar seus aplicativos de produção, você precisará da capacidade de restaurar as cargas de trabalho rapidamente. Seu plano de continuidade de negócios deve incluir uma estratégia de DR que atenda ao seu ponto de recuperação, tempo de recuperação e objetivos de orçamento. Uma topologia de luz piloto oferece um equilíbrio entre os requisitos de custo e recuperação.
O termo luz de pilha refere-se a uma pequena chama que está sempre acesa em dispositivos como aquecedores de gás e pode ser usado para iniciar os dispositivos rapidamente quando necessário. No contexto da DR, um ambiente de luz piloto contém os componentes básicos de uma determinada carga de trabalho, com a configuração mais recente e dados críticos, executados em uma escala mínima em um local remoto do site principal. No caso de um desastre no local principal, você pode usar os componentes de luz piloto no local remoto para restaurar um ambiente em escala de produção rapidamente.
O Oracle Cloud Infrastructure fornece infraestrutura e serviços altamente disponíveis e escaláveis que permitem projetar uma topologia de DR em voo piloto.
Arquitetura
Esta arquitetura mostra uma topologia de várias camadas que tem recursos redundantes distribuídos em duas regiões do Oracle Cloud Infrastructure.
O diagrama a seguir ilustra essa arquitetura de referência.

Descrição da ilustração x-region-pilot-light-topology.png
A arquitetura tem os seguintes componentes:
- Regiões
Uma região do Oracle Cloud Infrastructure é uma área geográfica localizada que contém um ou mais data centers, denominados domínios de disponibilidade. As regiões são independentes de outras regiões, e grandes distâncias podem separá-las (entre países ou continentes).
- Domínios de disponibilidade
Os domínios de disponibilidade são data centers independentes e independentes dentro de uma região. Os recursos físicos de cada domínio de disponibilidade são isolados dos recursos de outros domínios de disponibilidade, o que fornece tolerância a falhas. Os domínios de disponibilidade não compartilham infraestrutura como energia ou resfriamento ou a rede interna de domínios de disponibilidade. Portanto, não é possível afetar os outros domínios de disponibilidade na região.
O diagrama de arquitetura não mostra domínios de disponibilidade. Mas em regiões que têm vários domínios de disponibilidade, você pode distribuir os recursos de cada região entre os domínios de disponibilidade, para alta disponibilidade.
- Domínios de falha
Domínio de falha é um agrupamento de hardware e infraestrutura dentro de um domínio de disponibilidade. Cada domínio de disponibilidade tem três domínios de falha com energia e hardware independentes. Quando você distribui recursos entre vários domínios de falha, seus aplicativos podem tolerar falhas físicas do servidor, manutenção do sistema e falhas de alimentação dentro de um domínio de falha.
O diagrama da arquitetura não mostra domínios de falha. Mas para proteger contra falhas dentro de um domínio de falhas, você pode distribuir os recursos em cada disponibilidade entre os domínios de falha.
- VCN (redes virtuais na nuvem) e sub-redes
Uma VCN é uma rede personalizável definida por software que você configura em uma região do Oracle Cloud Infrastructure. Como as redes de data center tradicionais, as VCNs permitem controle total sobre seu ambiente de rede. Uma VCN pode ter vários blocos CIDR não sobrepostos que você poderá alterar após criar a VCN. Você pode segmentar uma VCN em sub-redes, que podem ter como escopo uma região ou um domínio de disponibilidade. Cada sub-rede consiste em um intervalo contíguo de endereços que não são sobrepostos com as outras sub-redes da VCN. Você pode alterar o tamanho de uma sub-rede após a criação. Uma sub-rede pode ser pública ou privada.
Nesta arquitetura de referência, todos os recursos de cada região são anexados a uma única VCN.
- Bastion host
O bastion host é uma instância de computação que serve como um ponto de entrada seguro e controlado para a topologia de fora da nuvem. O bastion host é provisionado tipicamente em uma zona desmilitarizada (DMZ). Ele permite que você proteja recursos confidenciais colocando-os em redes privadas que não podem ser acessadas diretamente de fora da nuvem. A topologia tem um único ponto de entrada conhecido que você pode monitorar e auditar regularmente. Portanto, você pode evitar a exposição dos componentes mais confidenciais da topologia sem comprometer o acesso a eles.
- Balanceador de carga
O serviço Oracle Cloud Infrastructure Load Balancing fornece distribuição automatizada de tráfego de um único ponto de entrada para vários servidores no back-end.
- Gateway de internet
O gateway de internet permite tráfego entre as sub-redes públicas em uma VCN e a internet pública.
- Instâncias de computação
A região principal inclui duas instâncias de computação para a camada de aplicativos.
A região em espera tem uma instância de computação para montar o armazenamento de arquivos replicado. As outras duas instâncias de computação na região stand-by representam servidores que você pode criar usando volumes de inicialização replicados e volumes em blocos, no caso de um desastre na região principal.
- Volumes em blocos
Com volumes de armazenamento em blocos, você pode criar, anexar, conectar e mover volumes de armazenamento e alterar o desempenho do volume para atender aos seus requisitos de armazenamento, desempenho e aplicativo. Depois de anexar e conectar um volume a uma instância, você pode usá-lo como disco rígido comum. Também é possível desconectar um volume e anexá-lo a outra instância sem perder dados.
A arquitetura mostra os volumes de inicialização e os volumes em blocos na região principal que estão sendo replicados para a região standby. Com esse design, no caso de um desastre na região principal, você pode restaurar a camada de aplicativos rapidamente na região standby, provisionando instâncias de computação usando a inicialização replicada e volumes em blocos.
- Armazenamento de arquivos
O serviço Oracle Cloud Infrastructure File Storage fornece um sistema de arquivos de rede durável, escalável e seguro e de nível empresarial. Você pode se conectar a um sistema de arquivos do serviço File Storage de qualquer instância bare metal, de máquina virtual ou de contêiner em uma VCN. Você também pode acessar um sistema de arquivos de fora da VCN usando o Oracle Cloud Infrastructure FastConnect e a VPN IPSec.
A arquitetura mostra o armazenamento de arquivos na região principal que está sendo replicado para a região standby usando um script.
- Armazenamento de objetos
O armazenamento de objetos fornece acesso rápido a grandes quantidades de dados estruturados e não estruturados de qualquer tipo de conteúdo, incluindo backups de bancos de dados, dados analíticos e conteúdo avançado, como imagens e vídeos. Você pode armazenar com segurança e recuperar dados diretamente da internet ou de dentro da plataforma de nuvem. Você pode dimensionar o armazenamento sem afetar qualquer degradação no desempenho ou na confiabilidade do serviço. Use o armazenamento padrão para armazenamento "dinâmico" necessário para acessar rapidamente, imediatamente e com frequência. Use o armazenamento de arquivos compactados para o armazenamento "frio" que você mantém por longos períodos de tempo e raramente ou raramente acessa.
A arquitetura mostra o armazenamento de objetos na região principal que está sendo replicada para a região standby automaticamente usando uma política de replicação entre regiões.
- Servidor do Aplicativo
Os servidores de aplicativos usam um par secundário que, como o banco de dados, assumirá o processamento em caso de desastre. Os servidores de aplicativos usam configuração e metadados armazenados no banco de dados e no sistema de arquivos. O agrupamento de servidores de aplicativos oferece proteção no escopo de uma única região, mas modificações contínuas e novas implantações precisam ser replicadas no local secundário continuamente para uma recuperação de desastres consistente.
- Banco de Dados
A arquitetura inclui um banco de dados em cada região. O Oracle Data Guard é usado para replicação de dados e garante que o banco de dados standby seja uma cópia transacionalmente consistente do banco de dados principal.
O Data Guard mantém automaticamente a sincronização entre os bancos de dados, transmitindo e aplicando dados de redo do banco de dados principal para o stand-by. No caso de um desastre na região principal, o Data Guard falha automaticamente no banco de dados standby.
- DRG (Dynamic Routing Gateway)
O DRG é um roteador virtual que fornece um caminho para o tráfego de rede privada entre uma VCN e uma rede fora da região, como uma VCN em outra região do Oracle Cloud Infrastructure, uma rede local ou uma rede em outro provedor de nuvem.
- Gateway NAT
O gateway NAT permite que recursos privados em uma VCN acessem hosts na internet, sem expor esses recursos a conexões de internet recebidas.
- Gateway de serviço
O gateway de serviço fornece acesso de uma VCN a outros serviços, como o Oracle Cloud Infrastructure Object Storage. O tráfego da VCN para o serviço Oracle viagens pela malha da rede Oracle e nunca atravessa a internet.
Recomendações
Use as recomendações a seguir como um ponto de partida para projetar sua topologia de DR de voo piloto. Os requisitos podem diferir da arquitetura descrita aqui.
- VCN
Quando você cria cada VCN, determine quantos endereços IP seus recursos de nuvem em cada sub-rede precisam. Usando a notação CASR (Classless Inter-Domain Routing), especifique uma máscara de sub-rede e uma faixa de endereços de rede que seja grande o suficiente para os endereços IP necessários. Use um intervalo de endereços que esteja dentro do espaço de endereço IP privado padrão.
Selecione blocos CIDR que não se sobreponham a nenhuma outra rede (no Oracle Cloud Infrastructure, seu data center local ou outro provedor de nuvem) para a qual você pretende configurar conexões privadas.
Depois de criar uma VCN, você poderá alterar, adicionar e remover seus blocos CIDR.
Ao projetar as sub-redes, considere seu fluxo de tráfego e os requisitos de segurança. Anexe todos os recursos dentro de uma camada ou função específica à mesma sub-rede, que pode servir como limite de segurança.
Use sub-redes regionais.
- Listas de segurança
Para permitir a replicação entre regiões do banco de dados e do armazenamento de arquivos, configure as listas de segurança necessárias. Observe que a replicação dos volumes de inicialização e em blocos não requer comunicação entre os hosts aos quais os volumes estão anexados.
- Política de backup de volumes em blocos
Configure uma política para fazer backups dos volumes em blocos com a frequência necessária para atender ao seu RPO.
- Servidores de Aplicativos e aplicativos personalizados executados no Oracle Platform as a Service (PaaS)
Os serviços PaaS, como o Oracle SOA Cloud Service e o Oracle WebLogic Server for Oracle Cloud Infrastructure, usam a maioria dos recursos mencionados acima internamente (computar, volumes em blocos, armazenamento de arquivos, rede, banco de dados). Eles exigem estratégias específicas de recuperação de desastres que protejam todas as camadas de forma consistente. A Oracle oferece melhores práticas detalhadas destinadas a criar arquiteturas de disponibilidade máxima (MAA) e proteger esse tipo de sistemas contra desastres. Consulte Explore Mais para obter uma documentação específica sobre recuperação de desastres (DR) para PaaS.
Considerações
Ao implementar sua configuração de DR de voo piloto, considere os seguintes fatores:
- Desempenho
Ao planejar o RPO e o RTO, considere o tempo necessário para que os backups de volume sejam copiados entre as regiões.
- Disponibilidade
Você pode usar o gerenciamento de orientação de DNS para redirecionar o tráfego do cliente para a região de produção atual após um failover.
Se você usar formas de computação que oferecem dispositivos NVMe conectados localmente, poderá fazer backup dos dados nesses dispositivos usando soluções de backup tradicionais que usam armazenamento de objetos.
- Custo
No caso de um failover do principal para a região em espera, você pode provisionar rapidamente a infraestrutura necessária usando scripts do Terraform. Você pode redimensionar os sistemas de banco de dados após provisioná-los; portanto, especifique a forma mínima necessária inicialmente e altere para uma forma maior após o failover.
Explorar Mais
Saiba mais sobre recuperação de desastres e resiliência no Oracle Cloud Infrastructure.
- Saiba como proteger sua topologia de nuvem contra desastres
- Configurar a conectividade privada entre regiões entre tenancies
- Implante um aplicativo web altamente disponível
Consulte os resumos técnicos de recuperação de desastres MAA para os seguintes serviços do Oracle PaaS:
SOA Suite no Oracle Cloud Infrastructure Marketplace - Recuperação de Desastres
Oracle WebLogic Server for Oracle Cloud Infrastructure Disaster Recovery