Implementa un'architettura di analisi dei dati multicloud in tempo reale in tutte le aree

Le organizzazioni spesso desiderano sfruttare le piattaforme di analitica esistenti per tutti i requisiti di analitica dei dati quando si tratta del cloud.

Questa soluzione multicloud descrive un'architettura di analisi dei dati ispirata al cliente con l'applicazione Oracle E-Business Suite su Oracle Cloud Infrastructure (OCI) negli Stati Uniti, mentre i dati di Oracle E-Business Suite vengono replicati in Microsoft Azure in Europa per Azure Synapse analytics quasi in tempo reale.

Gli strumenti di analitica e le origini dati sono connessi da una rete privata dedicata che garantisce bassa latenza e alta larghezza di banda per la replica dei dati. Oracle Cloud Infrastructure GoldenGate (OCI GoldenGate) viene utilizzato per la replica dei dati. I requisiti dei clienti sono stati soddisfatti con una soluzione di analisi dei dati multi-cloud:

  • La migrazione di Oracle Database on-premise a Oracle Base Database Service offre i vantaggi del massimo tempo di attività, prestazioni, scalabilità, sicurezza e produttività del database.
  • Mantenere lo stack Analytics in Microsoft Azure, eliminando così la necessità di apportare modifiche significative alle configurazioni/integrazioni per i consumatori a valle.
  • Utilizzando OCI GoldenGate per replicare i dati di modifica da Oracle Database a Azure Data Lake Gen2 e Azure Synapse in tempo reale.

Architettura

Questa architettura di riferimento mostra come abilitare la connettività privata a bassa latenza tra gli strumenti di analitica dei dati in un'area Microsoft Azure e la risorsa dati in un'area OCI remota.

Un partner FastConnect connette Azure ExpressRoute e Oracle Cloud Infrastructure FastConnect per entrare a far parte delle due reti cloud remote. La rete virtuale (VNet) sul traffico Microsoft Azure attraversa l'interconnessione privata alla rete cloud virtuale (VCN) su OCI.

Il database di produzione di Oracle E-Business Suite viene distribuito in Oracle Base Database Service come esempio. La soluzione è applicabile a Oracle Autonomous Database ed Exadata Database Service come database backend.

Poiché l'origine è Oracle Database e la destinazione è Azure Synapse/Azure Data Lake Storage Gen 2, la replica OCI GoldenGate viene distribuita in una subnet separata con le due distribuzioni seguenti:
  1. Distribuzione Oracle per l'acquisizione dei dati dal database Oracle E-Business Suite.
  2. Distribuzione di Big Data per applicare i dati acquisiti dal database Oracle E-Business Suite a Azure Synapse.
OCI GoldenGate acquisisce i dati da Oracle Database e replica tali dati in Azure Data Lake Gen2 e Azure Synapse quasi in tempo reale attraverso FastConnect. La replica OCI GoldenGate a Synapse utilizza il flusso di dati di staging e unione. I dati di modifica vengono posizionati nell'area intermedia in una posizione temporanea, ad esempio Azure Data Lake Storage Gen 2 in microbatches e alla fine uniti nella tabella di destinazione della sinapsi.

Il diagramma riportato di seguito illustra questa architettura di riferimento.



oci-multicloud-db-analytics-azure-arch-oracle.zip

L'architettura è dotata dei componenti elencati di seguito.

Componenti di Oracle Cloud Infrastructure

  • Autonomous Transaction Processing

    Oracle Autonomous Transaction Processing è un servizio di database a gestione autonoma, protezione automatica e funzionalità di riparazione ottimizzato per i carichi di lavoro di elaborazione delle transazioni. Non è necessario configurare o gestire hardware né installare software. Oracle Cloud Infrastructure gestisce la creazione del database, nonché il backup, l'applicazione di patch, l'aggiornamento e l'ottimizzazione del database.

  • FastConnect

    Oracle Cloud Infrastructure FastConnect consente di creare facilmente una connessione dedicata e privata tra il data center e Oracle Cloud Infrastructure. FastConnect fornisce opzioni a maggiore larghezza di banda e un'esperienza di rete più affidabile se confrontata con le connessioni basate su Internet.

  • Dominio di disponibilità

    I domini di disponibilità sono data center standalone indipendenti all'interno di un'area geografica. Le risorse fisiche in ciascun dominio di disponibilità sono isolate dalle risorse presenti negli altri domini di disponibilità, che offrono tolleranza agli errori. I domini di disponibilità non condividono l'infrastruttura, ad esempio alimentazione o raffreddamento o la rete interna del dominio di disponibilità. È pertanto improbabile che l'eventuale guasto di un dominio di disponibilità influenzi gli altri domini di disponibilità nell'area.

  • Rete cloud virtuale (VCN) e subnet

    Una VCN è una rete personalizzabile e definita dal software configurata in un'area Oracle Cloud Infrastructure. Analogamente alle reti di data center tradizionali, i VCN offrono il controllo completo sull'ambiente di rete. Una VCN può avere più blocchi CIDR non sovrapposti che puoi modificare dopo aver creato la VCN. Puoi segmentare una VCN nelle subnet che possono essere definite nell'area o in un dominio di disponibilità. Ogni subnet è composta da un intervallo contiguo di indirizzi che non si sovrappongono alle altre subnet nella VCN. Puoi modificare le dimensioni di una subnet dopo la creazione. Una subnet può essere pubblica o privata.

  • Lista di sicurezza

    Per ogni subnet, puoi creare regole di sicurezza che specifichino l'origine, la destinazione e il tipo di traffico che deve essere consentito all'interno e all'esterno della subnet.

  • Tabella di instradamento

    Le tabelle di instradamento virtuale contengono regole per instradare il traffico dalle subnet alle destinazioni esterne a una VCN, in genere tramite gateway.

  • Gateway di instradamento dinamico (DRG)

    DRG è un router virtuale che fornisce un percorso per il traffico di rete privato tra VCN nella stessa area, tra una VCN e una rete esterna all'area, come una VCN in un'altra area Oracle Cloud Infrastructure, una rete in locale o una rete in un altro provider cloud.

  • Oracle Cloud Infrastructure GoldenGate

    Oracle Cloud Infrastructure GoldenGate è un servizio completamente gestito che consente l'inclusione dei dati da origini residenti on premise o in qualsiasi cloud, sfruttando la tecnologia CDC GoldenGate per un'acquisizione non intrusiva ed efficiente dei dati e della consegna a Oracle Autonomous Data Warehouse in tempo reale e su larga scala, in modo da rendere le informazioni pertinenti disponibili ai consumatori il più rapidamente possibile.

Componenti di Microsoft Azure
  • Rete virtuale (VNet) e subnet

    Un VNet è una rete virtuale definita in Azure. Un elemento VNet può avere più subnet di blocchi CIDR non sovrapposte che è possibile aggiungere dopo la creazione di VNet. È possibile segmentare un elemento VNet in subnet che possono essere definite in un'area o in zone di disponibilità. Ogni subnet è composta da un intervallo contiguo di indirizzi che non si sovrappongono alle altre subnet in VNet. Utilizzare VNet per isolare logicamente le risorse Microsoft Azure a livello di rete.

  • ExpressRoute

    Azure ExpressRoute consente di impostare una connessione privata tra un VNet e un'altra rete, ad esempio una rete in locale o una rete in un altro provider cloud. ExpressRoute è un'alternativa più affidabile e più veloce alle connessioni tipiche di Internet, perché il traffico tramite ExpressRoute non attraversa la rete Internet pubblica.

  • Gateway rete virtuale

    Un gateway di rete virtuale consente il traffico tra un Azure VNet e una rete esterna a Azure, tramite la rete Internet pubblica o utilizzando ExpressRoute, a seconda del tipo di gateway specificato.

  • Tabella di instradamento

    Le tabelle di instradamento indirizzano il traffico diretto tra le subnet di Azure, VNets e le reti esterne a Azure.

  • Gruppo di sicurezza di rete

    Un gruppo di sicurezza di rete contiene regole per controllare il traffico di rete tra le risorse di Azure all'interno di un VNet. Ogni regola specifica l'origine o la destinazione, la porta, il protocollo e la direzione del traffico di rete consentiti o negati.

  • Analitica Azure Synapse

    Azure Synapse Analytics è un servizio di analisi che riunisce l'integrazione dei dati, il data warehousing aziendale e l'analisi dei Big Data. Consente di eseguire query sui dati secondo le tue condizioni, utilizzando opzioni serverless o dedicate, su larga scala. Azure Synapse riunisce questi concetti insieme a un'esperienza unificata per includere, esplorare, preparare, trasformare, gestire e servire i dati per esigenze immediate di BI e apprendimento automatico.

  • Azure Storage Data Lake Gen2

    Azure Data Lake Storage Gen2 è un set di funzionalità dedicate all'analisi dei big data, basate su Azure Blob Storage. Data Lake Storage Gen2 converte le funzionalità di Azure Data Lake Storage Gen1 con Azure Blob Storage. Ad esempio, Data Lake Storage Gen2 offre semantica del file system, sicurezza a livello di file e scalabilità. Poiché queste funzionalità sono basate sullo storage Blob, puoi anche ottenere storage a livelli a basso costo con alta disponibilità e funzionalità di disaster recovery.

Suggerimenti

Utilizzare i seguenti suggerimenti come punto di partenza. I requisiti potrebbero essere diversi dall'architettura descritta qui.
  • Provisioning

    Scegli la dimensione giusta dei circuiti virtuali Oracle Cloud Infrastructure FastConnect e Azure ExpressRoute per supportare la larghezza di banda necessaria per il carico di lavoro.

    Esegui il provisioning di Oracle Database utilizzando la rete cloud virtuale (VCN)/subnet OCI connessa al gateway di instradamento dinamico (DRG) OCI e all'indirizzo FastConnect OCI.

    Configurare l'instradamento e la sicurezza/gruppo di sicurezza di rete (NSG) in OCI per consentire al traffico di rete di Azure Synapse Analytics di Oracle Database.

    Per il database Oracle Cloud in un endpoint privato, specificare la configurazione della VCN per consentire il traffico solo dalla VCN specificata. Blocca l'accesso al database da tutti gli IP pubblici o da tutti i VCN.

Considerazioni

Quando si distribuisce questa architettura di riferimento, tenere presente quanto riportato di seguito.

  • Costo

    Oracle Cloud Infrastructure FastConnect: il costo di FastConnect è lo stesso in tutte le aree di Oracle Cloud Infrastructure. Non sono previsti addebiti separati per i dati in entrata o in uscita.

    Azure ExpressRoute: il costo di Azure ExpressRoute varia da un'area all'altra. Azure dispone di più SKU disponibili per un instradamento rapido; Oracle consiglia di utilizzare l'impostazione Locale, perché non prevede addebiti in entrata o in uscita separati e inizia con una larghezza di banda minima di 1 Gbps. Le configurazioni Standard e Premium offrono una larghezza di banda inferiore, ma comportano costi di uscita separati in un'impostazione sottoposta a misurazione.

    La scalabilità automatica di Oracle CPU (OCPU) in Oracle Autonomous Transaction Processing consente la gestione dei carichi di lavoro di picco quando necessario e riduce anche in modo significativo i costi di licenza.

  • Prestazioni

    Per il caso d'uso del cliente in questa architettura di riferimento, il requisito era quasi in tempo reale la replica dei dati dal database primario negli endpoint OCI-Azure. Con l'aiuto di OCI GoldenGate, i serbatoi di Big Data eterogenei e multicloud del cliente erano sempre aggiornati con dati in tempo reale provenienti dai sistemi di produzione operativi e analitici che consentono l'analisi in tempo reale.

  • Rete

    È possibile utilizzare Oracle Interconnect for Microsoft Azure anche come soluzione di rete alternativa. Oracle Interconnect for Microsoft Azure è disponibile solo in aree abbinate Azure-OCI specifiche. Per ulteriori informazioni, vedere Scopri quali aree di Azure e OCI supportano OracleDB per Azure nella sezione Scopri di più.

    Se le aree OCI e Azure non supportano Oracle Interconnect for Microsoft Azure, è possibile utilizzare la spina dorsale di ogni provider cloud (OCI e Azure) per trasportare il traffico. Se utilizzi il backbone OCI, devi creare un'area intermedia che includa l'area Oracle Interconnect disponibile per Microsoft Azure all'interno di OCI e Remote Peering Connection (RPC) all'area che non supporta Oracle Interconnect for Microsoft Azure.

    Nota:

    Se utilizzi il backbone OCI con RPC in una progettazione, devi utilizzare l'instradamento personalizzato a livello di gateway di instradamento dinamico (DRG) per instradare il traffico dall'area intermedia all'altra area, che non include l'area idonea per l'interconnessione. Per utilizzare il backbone di Azure, considera le SKU ExpressRoute locali, standard e premium per assicurarti di avere le SKU giuste per collegare le due aree all'interno di Azure. Inoltre, puoi prendere in considerazione l'uso del provider FastConnect con tre servizi come il router cloud Megaport.

Conferme

  • Author: Shrinidhi Kulkarni
  • Contributors: Wei Han, Atefeh Yousefi Attaei