Implemente uma arquitetura de análise de dados multicloud em tempo real entre regiões

Muitas vezes, as organizações querem aproveitar as plataformas de análise existentes para todos os seus requisitos de análise de dados quando se trata de nuvem.

Esta solução multinuvem descreve uma arquitetura de análise de dados inspirada no cliente com o aplicativo Oracle E-Business Suite no Oracle Cloud Infrastructure (OCI) nos EUA, enquanto os dados do Oracle E-Business Suite são replicados para o Microsoft Azure na Europa para análise do Azure Synapse quase em tempo real.

As ferramentas de análise e as origens de dados são conectadas por uma rede privada dedicada para fornecer baixa latência e alta largura de banda para replicação de dados. O Oracle Cloud Infrastructure GoldenGate (OCI GoldenGate) é usado para replicação de dados. Os requisitos do cliente foram tratados com uma solução de análise de dados multicloud ao:

  • Migrar o Oracle Database local para o Oracle Base Database Service, que oferece os benefícios do tempo de atividade, desempenho, escalabilidade, segurança e produtividade máximos do banco de dados.
  • Mantendo a pilha do Analytics no Microsoft Azure, eliminando assim a necessidade de fazer alterações significativas nas configurações/integrações para consumidores a jusante.
  • Usando o OCI GoldenGate para replicar dados de alteração do Oracle Database para o Azure Data Lake Gen2 e o Azure Synapse em tempo real.

Arquitetura

Essa arquitetura de referência mostra como você pode ativar a conectividade privada de baixa latência entre as ferramentas de análise de dados em uma região do Microsoft Azure e o recurso de dados em uma região remota do OCI.

Um parceiro FastConnect conecta o Azure ExpressRoute e o Oracle Cloud Infrastructure FastConnect para unir as duas redes remotas de nuvem. A rede virtual (VNet) no tráfego do Microsoft Azure atravessa a interconexão privada com a rede virtual na nuvem (VCN) no OCI.

O banco de dados de produção do Oracle E-Business Suite é implantado no Oracle Base Database Service como exemplo. A solução se aplica ao Oracle Autonomous Database e ao Exadata Database Service como banco de dados de backend.

Como a origem é o Oracle Database e o destino é o Azure Synapse/Azure Data Lake Storage Gen 2, a replicação do OCI GoldenGate é implantada em uma sub-rede separada com as duas implantações a seguir:
  1. Implantação da Oracle para capturar dados do banco de dados do Oracle E-Business Suite.
  2. Implantação de Big Data para aplicar os dados capturados do banco de dados do Oracle E-Business Suite ao Synapse do Azure.
O OCI GoldenGate captura dados do Oracle Database e replica esses dados para o Azure Data Lake Gen2 e o Azure Synapse quase em tempo real por meio de FastConnect. A replicação GoldenGate do OCI para Synapse usa o estágio e o fluxo de dados de mesclagem. Os dados de alteração são preparados em um local temporário, ou seja, o Azure Data Lake Storage Gen 2 em microbatches e eventualmente mesclados na tabela de destino de sinapses.

O diagrama a seguir ilustra essa arquitetura de referência.



oci-multicloud-db-analytics-azure-arch-oracle.zip

A arquitetura tem os seguintes componentes:

Componentes do Oracle Cloud Infrastructure

  • Autonomous Transaction Processing

    O Oracle Autonomous Transaction Processing é um serviço de banco de dados independente, com autoproteção e reparo otimizado para cargas de trabalho de processamento de transações. Você não precisa configurar nem gerenciar nenhum hardware, nem instalar nenhum software. O Oracle Cloud Infrastructure trata da criação do banco de dados, bem como do backup, aplicação de patches, upgrade e ajuste do banco de dados.

  • FastConnect

    O Oracle Cloud Infrastructure FastConnect fornece uma maneira fácil de criar uma conexão privada dedicada entre o seu data center e o Oracle Cloud Infrastructure. FastConnect oferece opções de largura de banda mais alta e uma experiência de rede mais confiável quando comparada com conexões baseadas em internet.

  • Domínio de disponibilidade

    Domínios de disponibilidade são data centers stand-alone e independentes dentro de uma região. Os recursos físicos de cada domínio de disponibilidade são isolados dos recursos de outros domínios de disponibilidade, o que oferece tolerância a falhas. Os domínios de disponibilidade não compartilham infraestrutura como energia ou refrigeração ou a rede interna do domínio de disponibilidade. Portanto, provavelmente uma falha em um domínio de disponibilidade não afetará os outros domínios de disponibilidade da região.

  • Rede virtual na nuvem (VCN) e sub-rede

    Uma VCN é uma rede personalizável e definida por software que você configura em uma região do Oracle Cloud Infrastructure. Como as redes tradicionais de data center, as VCNs oferecem total controle sobre seu ambiente de rede. Uma VCN pode ter vários blocos CIDR não sobrepostos que você pode alterar após a criação da VCN. Você pode segmentar uma VCN em sub-redes, com escopo definido para uma região ou para um domínio de disponibilidade. Cada sub-rede consiste em um intervalo contíguo de endereços que não se sobrepõem a outras sub-redes da VCN. Você pode alterar o tamanho de uma sub-rede após a criação. Uma sub-rede pode ser pública ou privada.

  • Lista de segurança

    Para cada sub-rede, você pode criar regras de segurança que especifiquem a origem, o destino e o tipo de tráfego que deve ser permitido dentro e fora da sub-rede.

  • Tabela de roteamento

    As tabelas de roteamento virtual contêm regras para rotear o tráfego de sub-redes para destinos fora de uma VCN, geralmente por meio de gateways.

  • Gateway de roteamento dinâmico (DRG)

    O DRG é um roteador virtual que fornece um caminho para o tráfego de rede privada entre VCNs na mesma região, entre uma VCN e uma rede fora da região, como uma VCN em outra região do Oracle Cloud Infrastructure, uma rede local ou uma rede em outro provedor de nuvem.

  • Oracle Cloud Infrastructure GoldenGate

    O Oracle Cloud Infrastructure GoldenGate é um serviço totalmente gerenciado que permite a ingestão de dados de origens residentes no local ou em qualquer nuvem, aproveitando a tecnologia CDC GoldenGate para uma captura não intrusiva e eficiente de dados e entrega para o Oracle Autonomous Data Warehouse em tempo real e em escala a fim de disponibilizar as informações relevantes aos clientes o mais rápido possível.

Componentes do Microsoft Azure
  • Rede virtual (VNet) e sub-rede

    Um VNet é uma rede virtual que você define no Azure. Um VNet pode ter várias sub-redes de blocos CIDR não sobrepostas que você pode adicionar depois de criar o VNet. Você pode segmentar um VNet em sub-redes, que podem ter escopo em uma região ou em zonas de disponibilidade. Cada sub-rede consiste em um intervalo contíguo de endereços que não se sobrepõem às outras sub-redes do VNet. Use VNet para isolar seus recursos do Microsoft Azure logicamente no nível da rede.

  • ExpressRoute

    O Azure ExpressRoute permite configurar uma conexão privada entre um VNet e outra rede, como sua rede local ou uma rede em outro provedor de nuvem. ExpressRoute é uma alternativa mais confiável e rápida para conexões de internet típicas, porque o tráfego de ExpressRoute não percorre a internet pública.

  • Gateway de rede virtual

    Um gateway de rede virtual permite tráfego entre um Azure VNet e uma rede fora do Azure, por meio da internet pública ou usando ExpressRoute, dependendo do tipo de gateway especificado.

  • Tabela de roteamento

    Tráfego direto de tabelas de roteamento entre sub-redes do Azure, VNets e redes fora do Azure.

  • Grupo de segurança de rede

    Um grupo de segurança de rede contém regras para controlar o tráfego de rede entre os recursos do Azure em um VNet. Cada regra especifica a origem ou o destino, a porta, o protocolo e a direção do tráfego na rede que é permitido ou negado.

  • Azure Synapse Analytics

    O Azure Synapse Analytics é um serviço de análise que reúne integração de dados, armazenamento de dados empresariais e análise de big data. Ele permite consultar dados em seus termos, usando opções sem servidor ou dedicadas, em escala. O Azure Synapse reúne esses conceitos com uma experiência unificada para ingerir, explorar, preparar, transformar, gerenciar e atender dados para necessidades imediatas de BI e machine learning.

  • Armazenamento do Data Lake do Azure Gen2

    O Azure Data Lake Storage Gen2 é um conjunto de recursos dedicados à análise de big data, criados no Azure Blob Storage. O Data Lake Storage Gen2 converte os recursos do Azure Data Lake Storage Gen1 com o Azure Blob Storage. Por exemplo, o Data Lake Storage Gen2 fornece semântica de sistema de arquivos, segurança em nível de arquivo e escala. Como esses recursos são criados no armazenamento Blob, você também obtém armazenamento em camadas de baixo custo com alta disponibilidade e recursos de recuperação de desastres.

Recomendações

Use as recomendações a seguir como ponto de partida. Seus requisitos podem ser diferentes da arquitetura descrita aqui.
  • Provisionamento

    Escolha o tamanho certo dos circuitos virtuais Oracle Cloud Infrastructure FastConnect e Azure ExpressRoute para suportar a necessidade de largura de banda para a carga de trabalho.

    Provisione o Oracle Database usando a rede virtual na nuvem (VCN)/sub-rede do OCI conectada ao OCI Dynamic Routing Gateway (DRG) e ao OCI FastConnect.

    Configure o roteamento e a segurança/NSG (Network Security Group) no OCI para permitir o tráfego de rede do Azure Synapse Analytics para o Oracle Database.

    Para o Oracle Cloud Database em um ponto final privado, especifique a configuração de VCN para permitir tráfego apenas da VCN especificada. Isso bloqueia o acesso ao banco de dados de todos os IPs públicos ou VCNs.

Considerações

Considere os pontos a seguir ao implantar essa arquitetura de referência.

  • Custo

    Oracle Cloud Infrastructure FastConnect: O custo de FastConnect é o mesmo em todas as regiões do Oracle Cloud Infrastructure. Não há encargos de dados de entrada ou saída separados.

    Azure ExpressRoute: O custo do Azure ExpressRoute varia de uma região para outra. O Azure tem mais de uma SKU disponível para uma rota expressa; a Oracle recomenda o uso da definição Local, porque não tem encargos de entrada ou saída separados e começa com a largura de banda mínima de 1 Gbps. As configurações Padrão e Premium oferecem menor largura de banda, mas incorrem em encargos de saída separados em uma configuração com medição de consumo.

    O Dimensionamento Automático do Oracle CPU (OCPU) no Oracle Autonomous Transaction Processing permite tratar cargas de trabalho de pico quando necessário e também reduz os custos de licença em grande medida como resultado.

  • Desempenho

    Para o caso de uso do cliente nessa arquitetura de referência, o requisito era replicação de dados quase em tempo real do banco de dados principal nos pontos finais do OCI para o Azure. Com a ajuda da OCI GoldenGate, os reservatórios de big data heterogêneos e multicloud dos clientes sempre estavam atualizados com dados em tempo real de seus sistemas de produção operacionais e analíticos, permitindo análise em tempo real.

  • Redes

    O Oracle Interconnect for Microsoft Azure também pode ser usado como uma solução de rede alternativa. O Oracle Interconnect for Microsoft Azure só está disponível em regiões pareadas específicas do Azure-OCI. Para obter mais informações, consulte Saiba o que as regiões do Azure e OCI suportam OracleDB para Azure na seção Explorar Mais.

    Se as regiões OCI e Azure não suportarem o Oracle Interconnect for Microsoft Azure, você poderá usar o backbone de cada provedor de nuvem (OCI e Azure) para transportar o tráfego. Se você usar o backbone do OCI, deverá criar uma região intermediária que inclua a região disponível do Oracle Interconnect para o Microsoft Azure no OCI e RPC (Remote Peering Connection) para a região que não suporta o Oracle Interconnect for Microsoft Azure.

    Observação:

    Se você usar o backbone do OCI com RPC em um design, deverá usar o roteamento personalizado no nível do DRG (Dynamic Routing Gateway) para rotear o tráfego da região intermediária para a outra região, que não inclui a região elegível para Interconexão. Para usar o backbone do Azure, considere as SKUs ExpressRoute locais, Padrão e premium para garantir que você tenha as SKUs certas para conectar as duas regiões dentro do Azure. Você também pode considerar o uso do provedor FastConnect com serviços de camada três, como o roteador de nuvem Megaport.

Confirmações

  • Author: Shrinidhi Kulkarni
  • Contributors: Wei Han, Atefeh Yousefi Attaei