Implante um Pipeline de Análise Multicloud com o Microsoft Azure Synapse e o Oracle Autonomous Database

Uma implantação em nuvem é um reflexo do ambiente de TI heterogêneo das empresas. As empresas querem otimizar o desempenho do custo e usar os melhores serviços ao migrar para a nuvem. A multicloud split stack data analytics pipeline meets the enterprise’s needs by directly connecting Azure Synapse Analytics to Oracle Autonomous Database on Shared Exadata Infrastructure through an interconnect for real-time business insight.

Essa arquitetura usa o runtime de integração (IR) do Azure para criar um ponto final privado para o Azure Synapse Analytics. O tráfego Synapse é roteado por meio do Oracle Interconnect for Azure privado para o ponto final privado do Oracle Autonomous Database on Shared Exadata Infrastructure no OCI.

Estes são alguns dos benefícios:
  • O pipeline de análise de dados multicloud fornece informações comerciais em tempo real
  • O Oracle Autonomous Database fornece serviço gerenciado orientado por aprendizado de máquina com baixo TCO
  • O Oracle Interconnect for Azure fornece uma conexão de rede privada dedicada, de alta largura de banda e baixa latência
  • O Azure Synapse Analytics reúne integração de dados, armazenamento de dados empresariais e análise de big data

Arquitetura

Essa arquitetura mostra uma implantação típica de várias nuvens com o Oracle E-Business Suite no OCI (Oracle Cloud Infrastructure) e no Azure Synapse Analytics no Microsoft Azure.

A pilha completa do Oracle E-Business Suite é implantada no OCI. Os dados de produção do Oracle E-Business Suite são replicados para o Oracle Autonomous Data Warehouse em tempo real usando o Oracle Cloud Infrastructure GoldenGate. O Azure Synapse Analytics acessa o data warehouse diretamente por meio do Oracle Interconnect for Azure. O Oracle Interconnect for Azure fornece uma conexão dedicada, de alta largura de banda e baixa latência entre o Azure e o OCI.

O diagrama a seguir ilustra essa arquitetura de referência.

Veja a seguir a descrição da ilustração multicloud-data-analytics-pipeline-azure.png
Descrição da ilustração multicloud-data-analytics-pipeline-azure.png

multicloud-data-analytics-pipeline-azure-oracle.zip

Os aplicativos e usuários locais se conectam às duas nuvens por meio da VPN ou de uma conexão dedicada, como o Oracle Cloud Infrastructure FastConnect ou o Azure ExpressRoute.

A interconexão privada entre o OCI e o Azure usa um IP ou ponto final privado para rotear o tráfego. O Autonomous Database com Ponto Final Privado é implantado em uma região OCI com Interconexão com o Azure. O Azure Synapse Analytics é uma oferta de plataforma como serviço (PaaS) que não tem um ponto final privado para bancos de dados Oracle. No entanto, o Azure oferece Runtime de Integração (IR) auto-hospedado que você pode implantar em uma máquina virtual (VM) e ponte entre o Oracle Autonomous Database e o Azure Synapse. Como o espaço de trabalho do Azure Managed Virtual Network (VNet) for Synapse não pode ser anexado diretamente ao Oracle Database for Azure VNet. É necessário um VNet autogerenciado para implantar o IR.

O host de runtime de integração auto-hospedado tem uma limitação de largura de banda de rede que pode não ser suficiente para transferir um alto volume de dados do banco de dados autônomo para o Azure Synapse Analytics dentro da janela necessária. Recomendamos implantar vários IRs para alta disponibilidade.

A arquitetura tem os seguintes componentes no OCI:

  • Região

    Uma região do Oracle Cloud Infrastructure é uma área geográfica localizada que contém um ou mais data centers, denominada domínios de disponibilidade. As regiões são independentes de outras regiões, e grandes distâncias podem separá-las (entre países ou até mesmo continentes).

  • Domínios de disponibilidade

    Domínios de disponibilidade são data centers stand-alone e independentes dentro de uma região. Os recursos físicos de cada domínio de disponibilidade são isolados dos recursos de outros domínios de disponibilidade, o que oferece tolerância a falhas. Os domínios de disponibilidade não compartilham infraestrutura como energia ou refrigeração ou a rede interna do domínio de disponibilidade. Portanto, provavelmente uma falha em um domínio de disponibilidade não afetará os outros domínios de disponibilidade da região.

  • Rede virtual na nuvem (VCN) e sub-redes

    Uma VCN é uma rede personalizável definida por software que você configura em uma região do Oracle Cloud Infrastructure. Como as redes tradicionais de data center, as VCNs oferecem total controle sobre seu ambiente de rede. Uma VCN pode ter vários blocos CIDR não sobrepostos que você pode alterar após a criação da VCN. Você pode segmentar uma VCN em sub-redes, com escopo definido para uma região ou para um domínio de disponibilidade. Cada sub-rede consiste em um intervalo contíguo de endereços que não se sobrepõem a outras sub-redes da VCN. Você pode alterar o tamanho de uma sub-rede após a criação. Uma sub-rede pode ser pública ou privada.

  • Serviço Bastion

    O Oracle Cloud Infrastructure Bastion oferece acesso seguro restrito e com tempo limitado a recursos que não têm pontos finais públicos e que exigem controles rígidos de acesso a recursos, como bare metal e máquinas virtuais, Oracle MySQL Database Service, Autonomous Transaction Processing (ATP), Oracle Container Engine for Kubernetes (OKE) e qualquer outro recurso que permita acesso ao Secure Shell Protocol (SSH). Com o serviço Oracle Cloud Infrastructure Bastion, você pode ativar o acesso a hosts privados sem implantar e manter um host de salto. Além disso, você ganha melhor postura de segurança com permissões baseadas em identidade e uma sessão SSH centralizada, auditada e limitada por tempo. O Oracle Cloud Infrastructure Bastion elimina a necessidade de um IP público para acesso bastion, eliminando o incômodo e a potencial superfície de ataque ao fornecer acesso remoto.

  • Balanceador de carga

    O serviço Oracle Cloud Infrastructure Load Balancing fornece distribuição de tráfego automatizada de um único ponto de entrada para vários servidores no back-end.

  • Oracle E-Business Suite

    O Oracle E-Business Suite é um conjunto de aplicativos de negócios integrados que permitem que as organizações tomem decisões melhores, reduzam custos e aumentem o desempenho. Os produtos fornecem soluções para gerenciamento de relacionamento com o cliente, gerenciamento de serviços, gerenciamento financeiro, gerenciamento de capital humano, gerenciamento de portfólio de projetos, aquisição avançada, gerenciamento da cadeia de suprimentos, planejamento da cadeia de valor e execução da cadeia de valor.

  • Oracle E-Business Suite Cloud Manager

    O Oracle E-Business Suite Cloud Manager é um aplicativo baseado na Web que orienta todos os principais fluxos de automação do Oracle E-Business Suite no Oracle Cloud Infrastructure, incluindo o provisionamento de novos ambientes, a execução de atividades de gerenciamento do ciclo de vida nesses ambientes e a restauração de ambientes locais.

    O Oracle E-Business Suite Cloud Manager foi projetado para simplificar as diversas tarefas que os administradores de banco de dados (DBAs) do Oracle E-Business Suite executam diariamente, com o objetivo de reduzir o esforço necessário para executá-las.

  • Oracle Cloud Infrastructure GoldenGate

    O Oracle Cloud Infrastructure GoldenGate é um serviço totalmente gerenciado que permite a ingestão de dados de origens residentes no local ou em qualquer nuvem, aproveitando a tecnologia CDC GoldenGate para uma captura não intrusiva e eficiente de dados e entrega para o Oracle Autonomous Data Warehouse em tempo real e em escala a fim de disponibilizar as informações relevantes aos clientes o mais rápido possível.

  • Autonomous Database

    O Oracle Autonomous Database é um ambiente de banco de dados pré-configurado totalmente gerenciado que você pode usar para cargas de trabalho de processamento de transações e data warehousing. Você não precisa configurar nem gerenciar nenhum hardware, nem instalar nenhum software. O Oracle Cloud Infrastructure trata da criação do banco de dados, bem como do backup, aplicação de patches, upgrade e ajuste do banco de dados.

  • Serviço Data Safe

    O Oracle Data Safe é um serviço de nuvem regional totalmente integrado e focado que fornece um conjunto completo de recursos para proteger dados confidenciais e regulamentados em bancos de dados Oracle. O Data Safe também suporta bancos de dados locais, Oracle Exadata Database Service on Cloud@Customer e implantações multicloud. Todos os clientes do Oracle Database podem reduzir o risco de uma violação de dados e simplificar a conformidade usando o Oracle Data Safe para avaliar o risco da configuração e do usuário, monitorar e auditar a atividade do usuário e descobrir, classificar e mascarar dados confidenciais.

  • Object Storage

    O armazenamento de objetos oferece acesso rápido a grandes quantidades de dados estruturados e não estruturados de qualquer tipo de conteúdo, incluindo backups de bancos de dados, dados analíticos e conteúdo avançado, como imagens e vídeos. Você pode armazenar de forma segura e depois recuperar dados diretamente da internet ou de dentro da plataforma da nuvem. Você pode dimensionar o armazenamento de forma integrada sem prejudicar o desempenho ou a confiabilidade do serviço. Use o armazenamento padrão para armazenamento de acesso frequente que você precisa acessar de forma rápida, imediata e com frequência. Use o armazenamento de arquivos compactados para armazenamento "frio" que você mantém por longos períodos de tempo e raramente acessa.

  • Auditoria

    O serviço Oracle Cloud Infrastructure Audit registra automaticamente as chamadas para todos os pontos finais suportados da API (application programming interface) pública do Oracle Cloud Infrastructure como eventos de log. Atualmente, todos os serviços suportam os logs do Oracle Cloud Infrastructure Audit.

  • Log
    O registro em log é um serviço altamente escalável e totalmente gerenciado que oferece acesso aos seguintes tipos de logs de seus recursos na nuvem:
    • Logs de Auditoria: Logs relacionados a eventos emitidos pelo serviço Audit.
    • Logs de serviço: Logs emitidos por serviços individuais, como API Gateway, Events, Functions, Load Balancing, Object Storage e logs de fluxo da VCN.
    • Logs personalizados: Logs que contêm informações de diagnóstico de aplicativos personalizados, outros provedores de nuvem ou um ambiente on-premises.
  • Política

    Uma política do Oracle Cloud Infrastructure Identity and Access Management especifica quem pode acessar quais recursos e como. O acesso é concedido no nível de grupo e compartimento. Isso significa que você pode gravar uma política que dá a um grupo um tipo específico de acesso em um compartimento específico ou à tenancy.

  • Serviço IAM (Identity and Access Management)

    Oracle Cloud Infrastructure Identity and Access Management (IAM) is the access control plane for Oracle Cloud Infrastructure (OCI) and Oracle Cloud Applications. A API do serviço IAM e a interface do usuário permitem que você gerencie domínios de identidades e os recursos dentro do domínio de identidades. Cada domínio de identidades do OCI IAM representa uma solução de gerenciamento de identidades e acesso independente ou outra população de usuários.

  • Gateway de roteamento dinâmico (DRG)

    O DRG é um roteador virtual que fornece um caminho para o tráfego de rede privada entre VCNs na mesma região, entre uma VCN e uma rede fora da região, como uma VCN em outra região do Oracle Cloud Infrastructure, uma rede local ou uma rede em outro provedor de nuvem.

  • Gateway de Internet

    O gateway de internet permite tráfego entre as sub-redes públicas em uma VCN e a internet pública.

  • Gateway de serviço

    O gateway de serviço fornece acesso de uma VCN a outros serviços, como o Oracle Cloud Infrastructure Object Storage. O tráfego da VCN para o serviço Oracle passa pela malha da rede Oracle e nunca atravessa a internet.

  • WAF (Web Application Firewall)

    O Oracle Cloud Infrastructure Web Application Firewall (WAF) é um serviço de conformidade com o setor de cartões de pagamento (PCI), baseado em região e de borda, que é anexado a um ponto de aplicação, como um balanceador de carga ou um nome de domínio de aplicativo web. O WAF protege aplicativos contra tráfego mal-icioso e indesejado na internet. O WAF pode proteger qualquer ponto final voltado para a Internet, fornecendo aplicação de regras consistente entre os aplicativos de um cliente.

  • Tabela de roteamento

    As tabelas de roteamento virtual contêm regras para rotear o tráfego de sub-redes para destinos fora de uma VCN, geralmente por meio de gateways.

  • Grupo de segurança de rede (NSG)

    O grupo de segurança de rede (NSG) atua como um firewall virtual para seus recursos de nuvem. Com o modelo de segurança de confiança zero do Oracle Cloud Infrastructure, todo o tráfego é negado, e você pode controlar o tráfego de rede dentro de uma VCN. Um NSG consiste em um conjunto de regras de segurança de entrada e saída que se aplicam somente a um conjunto especificado de VNICs em uma única VCN.

  • Lista de segurança

    Para cada sub-rede, você pode criar regras de segurança que especifiquem a origem, o destino e o tipo de tráfego que deve ser permitido dentro e fora da sub-rede.

A arquitetura tem os seguintes componentes no Azure:

  • Azure ExpressRoute

    O Microsoft Azure ExpressRoute permite configurar uma conexão privada entre um VNet e outra rede, como sua rede local ou uma rede em outro provedor de nuvem. ExpressRoute é uma alternativa mais confiável e rápida para conexões típicas da internet, porque o tráfego de ExpressRoute não percorre a internet pública.

  • Microsoft Azure VNet

    O Microsoft Azure Virtual Network (VNet) é o bloco de construção fundamental para sua rede privada no Azure. VNet permite que muitos tipos de recursos do Azure, como máquinas virtuais (VM) do Azure, se comuniquem entre si de forma segura, com a internet e com redes locais.

  • Runtime de Integração

    O Runtime de Integração fornece recursos de integração de dados em diferentes redes com pontos finais acessíveis pelo público.

    Os serviços do Microsoft Azure, como o Azure Synapse Analytics, usam o Runtime de Integração para integração de dados.

  • Azure Synapse Analytics

    O Azure Synapse Analytics é um serviço da Microsoft que fornece análises para data warehouses e sistemas de big data.

  • Azure Active Directory

    O Azure Active Directory é um serviço da Microsoft que armazena informações sobre objetos na rede e torna essas informações fáceis para os administradores e usuários encontrarem e usarem (como contas, privilégios, políticas de segurança, DNS). O Azure Active Directory usa um armazenamento de dados estruturado como base para uma organização lógica e hierárquica de informações de diretório.

Recomendações

Use as seguintes recomendações como ponto de partida. Seus requisitos podem ser diferentes da arquitetura descrita aqui.
  • Provisionamento
    • Provisione uma máquina virtual (VM) maior com largura de banda de rede maior no Azure para hospedar o Runtime de Integração (IR) e ative threads paralelos para transferência de dados entre o Oracle Autonomous Data Warehouse e o Azure Synapse Analytics.
    • Provisione mais de uma VM no Microsoft Azure para runtime de integração auto-hospedado a fim de evitar um único ponto de falha, e a largura de banda combinada dos hosts IR fornece o throughput necessário para a transferência de dados entre o Oracle Autonomous Data Warehouse e o Azure Synapse Analytics.
    • Provisione e implante o Azure IR em diferentes zonas de disponibilidade do Azure para obter a disponibilidade máxima.
    • Escolha o tamanho certo dos circuitos virtuais do Oracle Cloud Infrastructure FastConnect e do Azure ExpressRoute para suportar a necessidade de largura de banda para a carga de trabalho.
    • Provisione o Oracle Autonomous Data Warehouse usando a rede virtual na nuvem (VCN)/sub-rede do Oracle Cloud Infrastructure (OCI) conectada ao OCI Dynamic Routing Gateway (DRG) e ao OCI FastConnect.
    • Configure o roteamento e a segurança/Grupo de Segurança de Rede (NSG) no OCI para permitir o tráfego de rede do Azure Synapse Analytics para o Oracle Autonomous Data Warehouse.
    • Para o ponto final privado do Oracle Autonomous Database on Shared Exadata Infrastructure, especifique a configuração da VCN para permitir o tráfego somente da VCN especificada. Isso bloqueia o acesso ao banco de dados de todos os IPs públicos ou VCNs.
    • VCN

      Quando você cria uma VCN, determina o número de blocos CIDR necessários e o tamanho de cada bloco com base no número de recursos que planeja anexar às sub-redes na VCN. Use blocos CIDR que estão dentro do espaço de endereço IP privado padrão.

      Selecione blocos CIDR que não se sobrepõem a nenhuma outra rede (no Oracle Cloud Infrastructure, no seu data center local ou em outro provedor de nuvem) para a qual você pretende configurar conexões privadas.

      Depois de criar uma VCN, você poderá alterar, adicionar e remover seus blocos CIDR.

      Ao projetar as sub-redes, considere seu fluxo de tráfego e os requisitos de segurança. Anexe todos os recursos dentro de uma camada ou atribuição específica à mesma sub-rede, que pode servir como limite de segurança.

Considerações

Ao implantar essa arquitetura, considere o seguinte:

  • Aplicativos Embalados

    Essa arquitetura usa o Oracle E-Business Suite como exemplo. Ele se aplica a outros aplicativos de pacote, como PeopleSoft, JD Edwards EnterpriseOne, Siebel ou qualquer aplicativo 3rd criado no Oracle Database.

  • Oracle Autonomous Data Warehouse
    • Dimensione de forma adequada o banco de dados Autonomous Data Warehouse com a computação e o armazenamento necessários mais adequados para a carga de trabalho.
    • Ative o Dimensionamento Automático do banco de dados Autonomous Data Warehouse para suportar quaisquer cargas de trabalho adicionais.
    • Ative o backup Automático e selecione o período de retenção apropriado que suporta sua empresa.
    • Ative o Oracle Autonomous Data Guard para permitir que um banco de dados stand-by (de pareamento) forneça recuperação de desastres de proteção de dados para suas necessidades de negócios.
  • Replicação de dados
    • Se o Oracle E-Business Suite tiver uma instância de recuperação de desastres (DR), você poderá replicar os dados da instância de DR para o Autonomous Data Warehouse a fim de descarregar a carga de trabalho do banco de dados de produção do Oracle E-Business Suite.
    • Como alternativa ao Oracle GoldenGate, você pode usar o Oracle Cloud Infrastructure Data Integration para replicar os dados do banco de dados do Oracle E-Business Suite para o Autonomous Data Warehouse.

Aquisições

  • Authors: Wei Han, Niranjan Mohapatra, Ejaz Akram