Informazioni sull'utilizzo di Oracle Modern Data Platform for Business Reporting and Forecasting

Questo design esplora l'utilizzo di Oracle Modern Data Platform per il reporting e le previsioni aziendali.

Si consideri il caso d'uso in cui un'azienda dispone di una grande quantità di dati di vendita dei prodotti da origini interne ed esterne. Sebbene i dati storici e recenti sulle vendite abbiano valore per l'azienda, nella maggior parte dei casi vengono utilizzati solo i dati degli ultimi mesi o anni nell'attività quotidiana. I consumatori di questi dati sono utenti aziendali che li utilizzano per la generazione di report, l'analisi e le previsioni. Vogliono che i loro report e dashboard restituiscano rapidamente i risultati per massimizzare la produttività dei dipendenti.

Tradizionalmente, le aziende si affidavano ai data warehouse basati su database relazionali per segnalare casi d'uso come quello menzionato sopra. Tuttavia, queste implementazioni avevano diverse limitazioni: la scalabilità e le prestazioni sono le più importanti di tali limitazioni.

Architettura

Un approccio più moderno consiste nell'utilizzare un'architettura data lakehouse composta da OCI Object Storage, tecnologie Big Data come Hadoop, Spark e database a colonne o tradizionali per il reporting.

Oracle Cloud Infrastructure (OCI) ha una vasta gamma di strumenti e servizi che soddisfano tutti gli aspetti di una moderna piattaforma di dati. In questa soluzione, esaminiamo un piccolo sottoinsieme di servizi OCI che soddisfano i requisiti architettonici.

  1. OCI Object Storage: una piattaforma di storage su scala Internet ad alte prestazioni che offre durabilità dei dati affidabile ed efficiente in termini di costi. Può memorizzare una quantità illimitata di dati non strutturati di qualsiasi tipo di contenuto, inclusi dati analitici e contenuti avanzati, come immagini e video.
  2. Oracle Big Data Service: un servizio Hadoop gestito progettato per un set diversificato di casi d'uso e carichi di lavoro Big Data. Dai cluster di breve durata utilizzati per affrontare attività specifiche ai cluster di lunga durata che possono essere scalati orizzontalmente per soddisfare i requisiti di un'organizzazione a basso costo e con i massimi livelli di sicurezza.
  3. Oracle Autonomous Database: un database facile da usare e completamente autonomo, dotato di scalabilità elastica e in grado di garantire prestazioni rapide per le query. In quanto servizio, Autonomous Database non richiede l'amministrazione del database.
  4. Oracle Analytics Cloud: un servizio cloud pubblico scalabile e sicuro che offre agli analisti aziendali e ai consumatori moderne funzionalità di analitica self-service basate sull'intelligenza artificiale per la preparazione, la visualizzazione, il reporting aziendale, l'analisi migliorata e l'elaborazione del linguaggio naturale.

L'immagine seguente illustra l'architettura.
Segue la descrizione di oci-modern-data-reporting-arch.png
Descrizione dell'immagine oci-modern-data-reporting-arch.png

oci-modern-data-reporting-arch-oracle.zip

Ciascuno dei componenti dell'architettura elencati sopra funziona insieme nel modo seguente:
  • Il livello OCI Object Storage fornisce un modo affidabile e conveniente per memorizzare grandi quantità di dati. Lo storage degli oggetti ti offre un data store di persistenza comune che può essere utilizzato da più strumenti e servizi. Ciò garantisce anche che il livello di elaborazione dei dati possa essere ridimensionato indipendentemente dallo storage.
  • Il livello di elaborazione di Oracle Big Data Service offre una piattaforma per l'inclusione, la trasformazione e l'aggregazione di quantità di dati in blocco.
  • Il livello di database funge da metodo rapido ed efficiente che serve gli strumenti di reporting dei clienti con dati curati. In questo livello persistono dati recenti e, o solo dati pertinenti.
  • Oracle Analytics Cloud offre la possibilità di visualizzare i dati e fare previsioni.

Questa architettura supporta i componenti elencati di seguito.

  • Integrazione dei dati OCI

    Oracle Cloud Infrastructure Data Integration è un servizio completamente gestito, serverless e cloud nativo che estrae, carica, trasforma, pulisce e rimodella i dati da una vasta gamma di origini dati nei servizi Oracle Cloud Infrastructure di destinazione, come Autonomous Data Warehouse e Oracle Cloud Infrastructure Object Storage. ETL (extract transform load) sfrutta l'elaborazione di scale-out completamente gestita su Spark e ELT (extract load transform) sfrutta le funzionalità push-down SQL complete di Autonomous Data Warehouse per ridurre al minimo lo spostamento dei dati e migliorare il time-to-value per i dati appena inclusi. Gli utenti progettano i processi di integrazione dei dati utilizzando un'interfaccia utente intuitiva e senza codice che ottimizza i flussi di integrazione per generare il motore e l'orchestrazione più efficienti, allocando e ridimensionando automaticamente l'ambiente di esecuzione. Oracle Cloud Infrastructure Data Integration fornisce esplorazione interattiva e preparazione dei dati e aiuta i data engineer a proteggersi dalla deriva dello schema definendo le regole per gestire le modifiche allo schema.

  • Streaming

    Oracle Cloud Infrastructure Streaming offre una soluzione di storage completamente gestita, scalabile e duratura dedicata all'inclusione di flussi di dati continui e a elevato volume che puoi utilizzare ed elaborare in tempo reale. Puoi utilizzare Streaming per l'inclusione di dati a elevato volume, quali i log dell'applicazione, la telemetria operativa, i dati di click-stream Web o per altri casi d'uso in cui i dati vengono prodotti ed elaborati in modo continuo e sequenziale in un modello di messaggistica di tipo pubblicazione/iscrizione.