Data Platform - Data warehouse dipartimentale per Line of Business (LOB)

Utilizza Oracle Autonomous Data Warehouse e Oracle Analytics Cloud per caricare e ottimizzare i dati da Oracle E-Business Suite, fogli di calcolo, terze parti e altre fonti in un data warehouse centralizzato in modo che i dipartimenti possano analizzare i dati e ottenere insight utili.

Questa architettura di riferimento posiziona la soluzione tecnologica nel contesto aziendale complessivo:



Le linee di business in genere non dispongono di accesso tempestivo o efficiente ai dati e alle informazioni. Gli analisti raccolgono i dati manualmente, li utilizzano su base individuale e quindi condividono copie dei file tramite e-mail o file server. I dati non sono centralizzati, quindi garantire l'accuratezza e la sicurezza dei dati è difficile. L'analisi può richiedere molto tempo e i risultati non sono facilmente ripetibili.

Un data warehouse dipartimentale è una forma semplice di data warehouse che si concentra su un singolo argomento o area funzionale, ad esempio vendite, marketing o finanza, ed è spesso costruito e controllato da un singolo reparto all'interno di un'organizzazione. Dato il loro focus su un singolo soggetto, i data warehouse dipartimentali di solito traggono dati da poche origini. Le fonti potrebbero includere sistemi interni, un data warehouse centrale o dati esterni.

I data warehouse aziendali e dipartimentali possono fornire informazioni complete agli utenti aziendali e fornire in modo più efficace gli indicatori chiave di performance dell'organizzazione senza fare molto affidamento su risorse e disponibilità IT.

Architettura

Questa architettura utilizza Oracle Autonomous Data Warehouse per caricare e ottimizzare i dati provenienti da più sistemi finanziari, fogli di calcolo e altre origini dati in un data warehouse centralizzato, quindi utilizza Oracle Analytics Cloud per analizzare i dati e fornire informazioni utili.

Questa architettura supporta più casi d'uso. Il percorso più diretto offre un metodo semplice per acquisire, trasformare e caricare i dati nel data warehouse utilizzando gli strumenti integrati in Oracle Autonomous Data Warehouse (ADW). Altri percorsi supportano scenari che utilizzano un data lake o scenari con requisiti ETL (Extract, Transform and Load; estrazione, trasformazione e caricamento) più complessi.


Segue la descrizione del data-platform-ebs.png
Descrizione dell'illustrazione data-platform-ebs.png

data-platform-ebs-oracle.zip

L'architettura si concentra sulle seguenti divisioni logiche:

  • Inclusione, trasformazione, connessione

    Inclusione e perfezionamento dei dati da utilizzare in ciascun livello di dati nell'architettura.

  • Rendi persistenti, cura e crea

    Facilita l'accesso e la navigazione dei dati per mostrare la vista aziendale corrente. Per le tecnologie relazionali, i dati possono essere logici o fisicamente strutturati in forme semplici relazionali, longitudinali, dimensionali o OLAP. Per i dati non relazionali, questo livello contiene uno o più pool di dati, dall'output di un processo analitico o dai dati ottimizzati per un task analitico specifico.

  • Analizza, apprendi, prevedi

    Riassume la vista business logica dei dati per i consumatori. Questa astrazione facilita approcci agili allo sviluppo, la migrazione all'architettura di destinazione e la fornitura di un singolo layer di reporting da più origini federate.

Il diagramma riportato di seguito mostra un mapping dell'architettura ai servizi forniti su Oracle Cloud Infrastructure con la sicurezza di base.



oci-adb-oac-arch-public-oracle.zip

L'architettura prevede i seguenti componenti:

  • Autonomous Data Warehouse

    Oracle Autonomous Data Warehouse è un servizio di database self-driving, self-securing e self-repairing ottimizzato per i carichi di lavoro del data warehouse. Non è necessario configurare o gestire hardware o installare software. Oracle Cloud Infrastructure gestisce la creazione del database, nonché il backup, l'applicazione di patch, l'aggiornamento e il tuning del database.

  • Analitica

    Oracle Analytics Cloud è un servizio cloud pubblico scalabile e sicuro che fornisce un set completo di funzionalità per esplorare ed eseguire analisi collaborative per l'utente, per il gruppo di lavoro e per l'azienda.

    Con Oracle Analytics Cloud è inoltre possibile ottenere funzionalità di gestione dei servizi flessibili, tra cui configurazione rapida, facile scalabilità e applicazione delle patch e gestione automatizzata del ciclo di vita.

  • Integrazione dati

    Oracle Autonomous Data Warehouse include strumenti per acquisire, caricare e trasformare i dati per molti scenari dipartimentali.

    Per i casi d'uso avanzati, è possibile utilizzare Oracle Cloud Infrastructure Data Integration, un servizio cloud nativo completamente gestito, senza server che consente di eseguire task comuni di estrazione, caricamento e trasformazione (ETL), ad esempio l'ingestione di dati da origini diverse, la pulizia, la trasformazione e la rimodellamento di tali dati, quindi il caricamento efficiente nelle origini dati target in Oracle Cloud Infrastructure.

L'architettura include inoltre i componenti elencati di seguito.
  • Regione

    Un'area Oracle Cloud Infrastructure è un'area geografica localizzata che contiene uno o più data center, definiti domini di disponibilità. Le regioni sono indipendenti da altre regioni e grandi distanze possono separarle (in tutti i paesi o anche in continenti).

  • Compartimento

    I compartimenti sono partizioni logiche tra più aree all'interno di una tenancy di Oracle Cloud Infrastructure. Usare i compartimenti per organizzare le risorse in Oracle Cloud, controllare l'accesso alle risorse e impostare le quote di utilizzo. Per controllare l'accesso alle risorse in un determinato compartimento, definisci i criteri che specificano chi può accedere alle risorse e quali azioni può eseguire.

  • Gestione delle identità e degli accessi (IAM)

    Oracle Cloud Infrastructure Identity and Access Management (IAM) è il piano di controllo dell'accesso per Oracle Cloud Infrastructure (OCI) e Oracle Cloud Applications. L'interfaccia API IAM e l'interfaccia utente consentono di gestire i domini di Identity e le risorse all'interno del dominio di Identity. Ogni dominio di identità IAM OCI rappresenta una soluzione standalone di gestione delle identità e degli accessi o una popolazione di utenti diversa.

  • Criterio

    Un criterio di Oracle Cloud Infrastructure Identity and Access Management specifica chi può accedere a quali risorse e come. L'accesso viene concesso a livello di gruppo e compartimento. Ciò significa che puoi scrivere un criterio che concede a un gruppo un tipo specifico di accesso all'interno di un compartimento specifico o alla tenancy.

  • Dominio di disponibilità

    I domini di disponibilità sono data center standalone indipendenti all'interno di un'area geografica. Le risorse fisiche in ciascun dominio di disponibilità sono isolate dalle risorse presenti negli altri domini di disponibilità, che offrono tolleranza agli errori. I domini di disponibilità non condividono l'infrastruttura, ad esempio l'alimentazione o il raffreddamento, oppure la rete interna del dominio di disponibilità. Pertanto, è improbabile che l'eventuale guasto di un dominio di disponibilità influenzi gli altri domini di disponibilità dell'area.

  • Rete cloud virtuale (VCN) e subnet

    Una VCN è una rete personalizzabile e definita dal software configurata in un'area Oracle Cloud Infrastructure. Analogamente alle reti di data center tradizionali, i VCN offrono il controllo completo sull'ambiente di rete. Una VCN può avere più blocchi CIDR non sovrapposti che puoi modificare dopo aver creato la VCN. Puoi segmentare una VCN nelle subnet che possono essere definite nell'area o in un dominio di disponibilità. Ogni subnet è composta da un intervallo contiguo di indirizzi che non si sovrappongono alle altre subnet nella VCN. Puoi modificare le dimensioni di una subnet dopo la creazione. Una subnet può essere pubblica o privata.

  • Lista di sicurezza

    Per ogni subnet, puoi creare regole di sicurezza che specifichino l'origine, la destinazione e il tipo di traffico che deve essere consentito all'interno e all'esterno della subnet.

  • Tabella di instradamento

    Le tabelle di instradamento virtuale contengono regole per instradare il traffico dalle subnet alle destinazioni esterne a una VCN, in genere tramite gateway.

  • Gateway Internet

    Il gateway Internet consente il traffico tra le subnet pubbliche in una rete VCN e la rete Internet pubblica.

  • VPN da sito a sito

    VPN da sito a sito fornisce la connettività IPSec VPN tra la rete in locale e i VCN in Oracle Cloud Infrastructure. La suite di protocolli IPSec cifra il traffico IP prima che i pacchetti vengano trasferiti dall'origine alla destinazione e decifra il traffico all'arrivo.

  • Gateway di instradamento dinamico (DRG)

    DRG è un router virtuale che fornisce un percorso per il traffico di rete privato tra VCN nella stessa area, tra una VCN e una rete esterna all'area, come una VCN in un'altra area Oracle Cloud Infrastructure, una rete in locale o una rete in un altro provider cloud.

  • Gateway NAT (Network Address Translation)

    Un gateway NAT consente alle risorse private di una VCN di accedere agli host su Internet senza esporre tali risorse alle connessioni Internet in entrata.

  • Gateway del servizio

    Il gateway di servizi fornisce l'accesso da una VCN ad altri servizi, come Oracle Cloud Infrastructure Object Storage. Il traffico dalla VCN al servizio Oracle viaggia sulla struttura di rete Oracle e non attraversa mai Internet.

  • Gruppo di sicurezza di rete (NSG)

    Il gruppo di sicurezza di rete (NSG) agisce come firewall virtuale per le risorse cloud. Con il modello di sicurezza zero-trust di Oracle Cloud Infrastructure, tutto il traffico viene negato e puoi controllare il traffico di rete all'interno di una VCN. Un gruppo NSG è costituito da un set di regole di sicurezza in entrata e in uscita valide solo per un set specificato di VNIC in una singola VCN.

  • Memoria oggetti

    Lo storage degli oggetti garantisce un accesso rapido a grandi quantità di dati strutturati e non strutturati di qualsiasi tipo di contenuto, inclusi backup del database, dati analitici e contenuti avanzati, ad esempio immagini e video. Puoi memorizzare e recuperare i dati direttamente da Internet o dalla piattaforma cloud in tutta sicurezza. Puoi ridimensionare lo storage in modo trasparente senza alcun peggioramento a livello di prestazioni o affidabilità dei servizi. Utilizza lo storage standard per lo storage "hot" a cui devi accedere in modo rapido, immediato e frequente. Utilizzare lo storage di archivio per lo storage "freddo" che si mantiene per lunghi periodi di tempo e raramente può accedere.

Suggerimenti

Utilizzare i suggerimenti riportati di seguito come punto di partenza per caricare e ottimizzare i dati da più origini flat-file in una posizione centralizzata del data warehouse per l'analisi.

I requisiti potrebbero essere diversi dall'architettura descritta qui.

  • Raffineria dati

    Gli strumenti di Autonomous Database sono incorporati in Oracle Autonomous Data Warehouse e offrono la possibilità di caricare, trasformare, catalogare, ottenere insight e persino sviluppare modelli di business in modo semplice e diretto. Questi strumenti sono disponibili nel menu Azioni del database.

  • Oracle Analytics Cloud

    Prima di connettersi a Oracle Analytics Cloud a Oracle Autonomous Data Warehouse, chiedere a un amministratore del database di aggiungere l'indirizzo IP (o l'intervallo di indirizzi) per l'istanza di Oracle Analytics Cloud alla lista degli indirizzi consentiti. L'amministratore del database deve aggiungere al database una regola di sicurezza che consenta il traffico TCP/IP da Oracle Analytics Cloud.

Considerazioni

Durante il caricamento e l'ottimizzazione dei dati da più origini flat-file in una posizione centralizzata del data warehouse per l'analisi, prendere in considerazione queste opzioni di implementazione.

Orientamenti Raffineria dati Piattaforma Persistenza dati Accesso e interpretazione
Consigliato Strumenti Oracle Autonomous Database (azioni di database) Oracle Autonomous Data Warehouse Oracle Analytics Cloud
Altre opzioni Integrazione dati Oracle Cloud Infrastructure Oracle Exadata Database Service  
Motivazione Oracle Autonomous Data Warehouse è un database completamente autonomo e intuitivo che offre accesso diretto a una vasta gamma di origini dati, ad esempio file CSV e origini dati relazionali. Oracle Autonomous Data Warehouse è un database facile da usare, completamente autonomo e scalabile in modo elastico, offre prestazioni di query rapide e non richiede alcuna amministrazione del database. Offre inoltre l'accesso diretto ai dati dallo storage degli oggetti tramite tabelle esterne. Oracle Analytics Cloud è un servizio completamente gestito e perfettamente integrato con il livello di dati curato (Oracle Autonomous Data Warehouse).

Distribuire

Il codice Terraform per questa architettura di riferimento è disponibile in GitHub. È possibile estrarre il codice in Oracle Cloud Infrastructure Resource Manager con un solo clic, creare lo stack e distribuirlo. In alternativa, è possibile scaricare il codice da GitHub al computer, personalizzare il codice e distribuire l'architettura utilizzando l'interfaccia CLI (Command Line Interface) di Terraform.

  • Distribuisci utilizzando Oracle Cloud Infrastructure Resource Manager:
    1. Fare clic su Distribuisci in Oracle Cloud

      Se non si è già connessi, immettere la tenancy e le credenziali utente.

    2. Rivedere e accettare i termini e le condizioni.
    3. Selezionare l'area in cui distribuire lo stack.
    4. Seguire i prompt visualizzati e le istruzioni per creare lo stack.
    5. Dopo aver creato lo stack, fare clic su Azioni Terraform e selezionare Piano.
    6. Attendere il completamento del job, quindi rivedere il piano.

      Per apportare modifiche, tornare alla pagina Dettagli stack, fare clic su Modifica stack e apportare le modifiche desiderate. Eseguire di nuovo l'azione Piano.

    7. Se non sono necessarie ulteriori modifiche, tornare alla pagina Dettagli stack, fare clic su Azioni Terraform e selezionare Applica.
  • Distribuire utilizzando il codice Terraform in GitHub:
    1. Vai a GitHub.
    2. Duplicare o scaricare il repository nel computer locale.
    3. Seguire le istruzioni contenute nel documento README.

Log delle modifiche

Questo log elenca solo le modifiche significative: