Data Platform - Data warehouse dipartimentale per Line of Business (LOB)
Utilizza Oracle Autonomous Data Warehouse e Oracle Analytics Cloud per caricare e ottimizzare i dati da Oracle E-Business Suite, fogli di calcolo, terze parti e altre fonti in un data warehouse centralizzato in modo che i dipartimenti possano analizzare i dati e ottenere insight utili.
Questa architettura di riferimento posiziona la soluzione tecnologica nel contesto aziendale complessivo:
Le linee di business in genere non dispongono di accesso tempestivo o efficiente ai dati e alle informazioni. Gli analisti raccolgono i dati manualmente, li utilizzano su base individuale e quindi condividono copie dei file tramite e-mail o file server. I dati non sono centralizzati, quindi garantire l'accuratezza e la sicurezza dei dati è difficile. L'analisi può richiedere molto tempo e i risultati non sono facilmente ripetibili.
Un data warehouse dipartimentale è una forma semplice di data warehouse che si concentra su un singolo argomento o area funzionale, ad esempio vendite, marketing o finanza, ed è spesso costruito e controllato da un singolo reparto all'interno di un'organizzazione. Dato il loro focus su un singolo soggetto, i data warehouse dipartimentali di solito traggono dati da poche origini. Le fonti potrebbero includere sistemi interni, un data warehouse centrale o dati esterni.
I data warehouse aziendali e dipartimentali possono fornire informazioni complete agli utenti aziendali e fornire in modo più efficace gli indicatori chiave di performance dell'organizzazione senza fare molto affidamento su risorse e disponibilità IT.
Architettura
Questa architettura utilizza Oracle Autonomous Data Warehouse per caricare e ottimizzare i dati provenienti da più sistemi finanziari, fogli di calcolo e altre origini dati in un data warehouse centralizzato, quindi utilizza Oracle Analytics Cloud per analizzare i dati e fornire informazioni utili.
Questa architettura supporta più casi d'uso. Il percorso più diretto offre un metodo semplice per acquisire, trasformare e caricare i dati nel data warehouse utilizzando gli strumenti integrati in Oracle Autonomous Data Warehouse (ADW). Altri percorsi supportano scenari che utilizzano un data lake o scenari con requisiti ETL (Extract, Transform and Load; estrazione, trasformazione e caricamento) più complessi.

Descrizione dell'illustrazione data-platform-ebs.png
L'architettura si concentra sulle seguenti divisioni logiche:
- Inclusione, trasformazione, connessione
Inclusione e perfezionamento dei dati da utilizzare in ciascun livello di dati nell'architettura.
- Rendi persistenti, cura e crea
Facilita l'accesso e la navigazione dei dati per mostrare la vista aziendale corrente. Per le tecnologie relazionali, i dati possono essere logici o fisicamente strutturati in forme semplici relazionali, longitudinali, dimensionali o OLAP. Per i dati non relazionali, questo livello contiene uno o più pool di dati, dall'output di un processo analitico o dai dati ottimizzati per un task analitico specifico.
- Analizza, apprendi, prevedi
Riassume la vista business logica dei dati per i consumatori. Questa astrazione facilita approcci agili allo sviluppo, la migrazione all'architettura di destinazione e la fornitura di un singolo layer di reporting da più origini federate.
Il diagramma riportato di seguito mostra un mapping dell'architettura ai servizi forniti su Oracle Cloud Infrastructure con la sicurezza di base.
oci-adb-oac-arch-public-oracle.zip
L'architettura prevede i seguenti componenti:
- Autonomous Data Warehouse
Oracle Autonomous Data Warehouse è un servizio di database self-driving, self-securing e self-repairing ottimizzato per i carichi di lavoro del data warehouse. Non è necessario configurare o gestire hardware o installare software. Oracle Cloud Infrastructure gestisce la creazione del database, nonché il backup, l'applicazione di patch, l'aggiornamento e il tuning del database.
- Analitica
Oracle Analytics Cloud è un servizio cloud pubblico scalabile e sicuro che fornisce un set completo di funzionalità per esplorare ed eseguire analisi collaborative per l'utente, per il gruppo di lavoro e per l'azienda.
Con Oracle Analytics Cloud è inoltre possibile ottenere funzionalità di gestione dei servizi flessibili, tra cui configurazione rapida, facile scalabilità e applicazione delle patch e gestione automatizzata del ciclo di vita.
- Integrazione dati
Oracle Autonomous Data Warehouse include strumenti per acquisire, caricare e trasformare i dati per molti scenari dipartimentali.
Per i casi d'uso avanzati, è possibile utilizzare Oracle Cloud Infrastructure Data Integration, un servizio cloud nativo completamente gestito, senza server che consente di eseguire task comuni di estrazione, caricamento e trasformazione (ETL), ad esempio l'ingestione di dati da origini diverse, la pulizia, la trasformazione e la rimodellamento di tali dati, quindi il caricamento efficiente nelle origini dati target in Oracle Cloud Infrastructure.
- Regione
Un'area Oracle Cloud Infrastructure è un'area geografica localizzata che contiene uno o più data center, definiti domini di disponibilità. Le regioni sono indipendenti da altre regioni e grandi distanze possono separarle (in tutti i paesi o anche in continenti).
- Compartimento
I compartimenti sono partizioni logiche tra più aree all'interno di una tenancy di Oracle Cloud Infrastructure. Usare i compartimenti per organizzare le risorse in Oracle Cloud, controllare l'accesso alle risorse e impostare le quote di utilizzo. Per controllare l'accesso alle risorse in un determinato compartimento, definisci i criteri che specificano chi può accedere alle risorse e quali azioni può eseguire.
- Gestione delle identità e degli accessi (IAM)
Oracle Cloud Infrastructure Identity and Access Management (IAM) è il piano di controllo dell'accesso per Oracle Cloud Infrastructure (OCI) e Oracle Cloud Applications. L'interfaccia API IAM e l'interfaccia utente consentono di gestire i domini di Identity e le risorse all'interno del dominio di Identity. Ogni dominio di identità IAM OCI rappresenta una soluzione standalone di gestione delle identità e degli accessi o una popolazione di utenti diversa.
- Criterio
Un criterio di Oracle Cloud Infrastructure Identity and Access Management specifica chi può accedere a quali risorse e come. L'accesso viene concesso a livello di gruppo e compartimento. Ciò significa che puoi scrivere un criterio che concede a un gruppo un tipo specifico di accesso all'interno di un compartimento specifico o alla tenancy.
- Dominio di disponibilità
I domini di disponibilità sono data center standalone indipendenti all'interno di un'area geografica. Le risorse fisiche in ciascun dominio di disponibilità sono isolate dalle risorse presenti negli altri domini di disponibilità, che offrono tolleranza agli errori. I domini di disponibilità non condividono l'infrastruttura, ad esempio l'alimentazione o il raffreddamento, oppure la rete interna del dominio di disponibilità. Pertanto, è improbabile che l'eventuale guasto di un dominio di disponibilità influenzi gli altri domini di disponibilità dell'area.
- Rete cloud virtuale (VCN) e subnet
Una VCN è una rete personalizzabile e definita dal software configurata in un'area Oracle Cloud Infrastructure. Analogamente alle reti di data center tradizionali, i VCN offrono il controllo completo sull'ambiente di rete. Una VCN può avere più blocchi CIDR non sovrapposti che puoi modificare dopo aver creato la VCN. Puoi segmentare una VCN nelle subnet che possono essere definite nell'area o in un dominio di disponibilità. Ogni subnet è composta da un intervallo contiguo di indirizzi che non si sovrappongono alle altre subnet nella VCN. Puoi modificare le dimensioni di una subnet dopo la creazione. Una subnet può essere pubblica o privata.
- Lista di sicurezza
Per ogni subnet, puoi creare regole di sicurezza che specifichino l'origine, la destinazione e il tipo di traffico che deve essere consentito all'interno e all'esterno della subnet.
- Tabella di instradamento
Le tabelle di instradamento virtuale contengono regole per instradare il traffico dalle subnet alle destinazioni esterne a una VCN, in genere tramite gateway.
- Gateway Internet
Il gateway Internet consente il traffico tra le subnet pubbliche in una rete VCN e la rete Internet pubblica.
- VPN da sito a sito
VPN da sito a sito fornisce la connettività IPSec VPN tra la rete in locale e i VCN in Oracle Cloud Infrastructure. La suite di protocolli IPSec cifra il traffico IP prima che i pacchetti vengano trasferiti dall'origine alla destinazione e decifra il traffico all'arrivo.
- Gateway di instradamento dinamico (DRG)
DRG è un router virtuale che fornisce un percorso per il traffico di rete privato tra VCN nella stessa area, tra una VCN e una rete esterna all'area, come una VCN in un'altra area Oracle Cloud Infrastructure, una rete in locale o una rete in un altro provider cloud.
- Gateway NAT (Network Address Translation)
Un gateway NAT consente alle risorse private di una VCN di accedere agli host su Internet senza esporre tali risorse alle connessioni Internet in entrata.
- Gateway del servizio
Il gateway di servizi fornisce l'accesso da una VCN ad altri servizi, come Oracle Cloud Infrastructure Object Storage. Il traffico dalla VCN al servizio Oracle viaggia sulla struttura di rete Oracle e non attraversa mai Internet.
- Gruppo di sicurezza di rete (NSG)
Il gruppo di sicurezza di rete (NSG) agisce come firewall virtuale per le risorse cloud. Con il modello di sicurezza zero-trust di Oracle Cloud Infrastructure, tutto il traffico viene negato e puoi controllare il traffico di rete all'interno di una VCN. Un gruppo NSG è costituito da un set di regole di sicurezza in entrata e in uscita valide solo per un set specificato di VNIC in una singola VCN.
- Memoria oggetti
Lo storage degli oggetti garantisce un accesso rapido a grandi quantità di dati strutturati e non strutturati di qualsiasi tipo di contenuto, inclusi backup del database, dati analitici e contenuti avanzati, ad esempio immagini e video. Puoi memorizzare e recuperare i dati direttamente da Internet o dalla piattaforma cloud in tutta sicurezza. Puoi ridimensionare lo storage in modo trasparente senza alcun peggioramento a livello di prestazioni o affidabilità dei servizi. Utilizza lo storage standard per lo storage "hot" a cui devi accedere in modo rapido, immediato e frequente. Utilizzare lo storage di archivio per lo storage "freddo" che si mantiene per lunghi periodi di tempo e raramente può accedere.
Suggerimenti
Utilizzare i suggerimenti riportati di seguito come punto di partenza per caricare e ottimizzare i dati da più origini flat-file in una posizione centralizzata del data warehouse per l'analisi.
I requisiti potrebbero essere diversi dall'architettura descritta qui.
- Raffineria dati
Gli strumenti di Autonomous Database sono incorporati in Oracle Autonomous Data Warehouse e offrono la possibilità di caricare, trasformare, catalogare, ottenere insight e persino sviluppare modelli di business in modo semplice e diretto. Questi strumenti sono disponibili nel menu Azioni del database.
- Oracle Analytics Cloud
Prima di connettersi a Oracle Analytics Cloud a Oracle Autonomous Data Warehouse, chiedere a un amministratore del database di aggiungere l'indirizzo IP (o l'intervallo di indirizzi) per l'istanza di Oracle Analytics Cloud alla lista degli indirizzi consentiti. L'amministratore del database deve aggiungere al database una regola di sicurezza che consenta il traffico TCP/IP da Oracle Analytics Cloud.
Considerazioni
Durante il caricamento e l'ottimizzazione dei dati da più origini flat-file in una posizione centralizzata del data warehouse per l'analisi, prendere in considerazione queste opzioni di implementazione.
Orientamenti | Raffineria dati | Piattaforma Persistenza dati | Accesso e interpretazione |
---|---|---|---|
Consigliato | Strumenti Oracle Autonomous Database (azioni di database) | Oracle Autonomous Data Warehouse | Oracle Analytics Cloud |
Altre opzioni | Integrazione dati Oracle Cloud Infrastructure | Oracle Exadata Database Service | |
Motivazione | Oracle Autonomous Data Warehouse è un database completamente autonomo e intuitivo che offre accesso diretto a una vasta gamma di origini dati, ad esempio file CSV e origini dati relazionali. | Oracle Autonomous Data Warehouse è un database facile da usare, completamente autonomo e scalabile in modo elastico, offre prestazioni di query rapide e non richiede alcuna amministrazione del database. Offre inoltre l'accesso diretto ai dati dallo storage degli oggetti tramite tabelle esterne. | Oracle Analytics Cloud è un servizio completamente gestito e perfettamente integrato con il livello di dati curato (Oracle Autonomous Data Warehouse). |
Distribuire
Il codice Terraform per questa architettura di riferimento è disponibile in GitHub. È possibile estrarre il codice in Oracle Cloud Infrastructure Resource Manager con un solo clic, creare lo stack e distribuirlo. In alternativa, è possibile scaricare il codice da GitHub al computer, personalizzare il codice e distribuire l'architettura utilizzando l'interfaccia CLI (Command Line Interface) di Terraform.
- Distribuisci utilizzando Oracle Cloud Infrastructure Resource Manager:
- Fare clic su
Se non si è già connessi, immettere la tenancy e le credenziali utente.
- Rivedere e accettare i termini e le condizioni.
- Selezionare l'area in cui distribuire lo stack.
- Seguire i prompt visualizzati e le istruzioni per creare lo stack.
- Dopo aver creato lo stack, fare clic su Azioni Terraform e selezionare Piano.
- Attendere il completamento del job, quindi rivedere il piano.
Per apportare modifiche, tornare alla pagina Dettagli stack, fare clic su Modifica stack e apportare le modifiche desiderate. Eseguire di nuovo l'azione Piano.
- Se non sono necessarie ulteriori modifiche, tornare alla pagina Dettagli stack, fare clic su Azioni Terraform e selezionare Applica.
- Fare clic su
- Distribuire utilizzando il codice Terraform in GitHub:
- Vai a GitHub.
- Duplicare o scaricare il repository nel computer locale.
- Seguire le istruzioni contenute nel documento
README
.
Esplora altro
Ulteriori informazioni sulle architetture correlate e sulle caratteristiche di questa architettura.
Log delle modifiche
Questo log elenca solo le modifiche significative:
Giugno 20, 2023 | Aggiornata la sezione Distribuisci per rimuovere le opzioni di distribuzione di soluzioni complete e di piccole dimensioni. |
8 dicembre 2022 |
|
10 febbraio 2022 | Aggiornamento della sezione Distribuisci e dei collegamenti inclusi per la distribuzione di soluzioni complete e di soluzioni di piccole dimensioni. |
12 novembre 2021 | È stata aggiunta l'opzione per scaricare versioni modificabili (.SVG e .DRAWIO) del diagramma dell'architettura. |
17 marzo 2021 |
|
11 dicembre 2020 | Aggiornata la sezione Distribuisci per distribuire lo stack in GitHub direttamente in Oracle Cloud Infrastructure Resource Manager con un solo clic. |
21 settembre 2020 | Aggiornata la sezione Distribuisci per includere un collegamento a Oracle Cloud Infrastructure Resource Manager come origine per lo stack Terraform. |
Giugno 29, 2020 | Il collegamento GitHub nella sezione Distribuisci è stato aggiornato per puntare alla cartella caso d'uso specifica nella cartella del progetto. |