Esegui l'analisi dei dati multi-cloud con la moderna piattaforma dati Oracle

Le organizzazioni possono creare un data warehouse aziendale in cui memorizzare i dati sia attivi che archiviati da un'unica posizione.

I dati vengono generati a seguito del completamento di processi aziendali, delle operazioni eseguite o dei prodotti venduti. A causa di fonti di dati eterogenee, le organizzazioni vogliono adottare un approccio semplificato alla creazione di un data store centralizzato, un one-stop shop per tutte le esigenze di analisi dei dati. A causa della varietà di fonti, come i dati segnalati da utenti, produttori, distributori, partner e fornitori di terze parti, insieme agli ordini retail giornalieri e ai feedback dei clienti, l'obiettivo è creare un repository di data warehouse aziendale centralizzato che sia stato estratto e analizzato dalle funzioni aziendali per creare visibilità aziendale end-to-end e rispondere con informazioni basate sui dati.

Le organizzazioni vogliono sfruttare le informazioni e prendere decisioni basate sui dati per gestire le proprie attività in modo più efficiente. Questa soluzione di analisi dei dati multicloud consente alle organizzazioni di eseguire in modo efficace l'analisi utilizzando un data warehouse centrale sulla moderna piattaforma dati Oracle con integrazioni a più origini dati, come Oracle Fusion Cloud Enterprise Resource Planning, Microsoft Azure SQL Server (SQL Server), Salesforce, eBay e Google Analytics on-premise.

I vantaggi includono:

  • Una pipeline unificata di analisi dei dati

    Accesso semplificato a tutti i dati nei cloud e nelle installazioni on premise, inclusi i dati memorizzati in database e aree di memorizzazione degli oggetti.

  • Facilità di integrazione

    Integra i dati da sistemi eterogenei: dati federati, orchestrati, sincronizzati e mashup. Integra qualsiasi dato, formato, API, a qualsiasi velocità, con qualsiasi applicazione o con qualsiasi dispositivo. Tutto questo abilitando la collaborazione sicura, rispettando le regole di sicurezza e senza scrivere codice.

  • Analytics ad alte prestazioni

    L'accesso rapido ai dati mediante strumenti di query consente decisioni rapide e un'assistenza clienti più efficace.

  • Funzionalità di analitica avanzate

    Abilita tecniche analitiche avanzate come data e text mining, apprendimento automatico, previsione, analisi delle opinioni, analisi di rete e cluster, analisi dei grafici, elaborazione complessa degli eventi e reti neurali.

  • Singola piattaforma

    Una singola piattaforma basata su cloud per aumentare la collaborazione all'interno dei team, migliorare l'esecuzione e il time-to-market e accelerare l'innovazione.

  • Costi, sicurezza e disponibilità

    Le organizzazioni vogliono ridurre le spese in conto capitale (CapEx) e le spese operative (OpEx), ma vogliono anche avere un buon mix di costi rispetto alle prestazioni con sicurezza e disponibilità.

Architettura

Questa architettura di riferimento mostra una pipeline di analisi dei dati multicloud aziendale che acquisisce e formatta i dati da origini diverse, li sposta nel data warehouse aziendale su Oracle Cloud Infrastructure (OCI) e li analizza utilizzando Oracle Analytics Cloud (OAC).

I dati vengono integrati da varie origini utilizzando i servizi di integrazione Oracle Integration e OCI. Le origini dati mostrate sono Salesforce, eBay, SQL Server, Oracle Fusion Cloud Service e Google Analytics, ma la soluzione si applica a qualsiasi origine dati che accetta chiamate API o connessioni al database. I servizi di integrazione OCI connettono qualsiasi applicazione e origine dati per automatizzare i processi end-to-end e centralizzare la gestione. L'ampia gamma di integrazioni, con adattatori predefiniti e personalizzazione a basso codice, semplifica la migrazione nel cloud semplificando al contempo le operazioni multicloud.

Oracle Integration (OIC) connette qualsiasi applicazione, dati e servizio, inclusi Salesforce e eBay, Oracle Fusion Cloud Service ed ecosistemi di partner per le comunicazioni business-to-business (B2B). I dati vengono integrati da origini diverse utilizzando i servizi Oracle Integration. Una volta che i dati sono disponibili da tutte le diverse origini del livello di staging, i dati vengono quindi puliti, standardizzati, uniti e trasformati utilizzando Integrazione dati. ADW memorizza il livello intermedio, i dati di riferimento e il livello analitico. OAC viene utilizzato come strumento analitico per generare dashboard, report, KPI e per generare analitica self-service in tutta l'organizzazione. I connettori predefiniti di OAC possono essere utilizzati per replicare e unire i dati di Google Analytics.



oci-multicloud-data-analytics-diagram-oracle.zip

Integrazione delle origini dati:

  • Integrazione con Google Analytics

    L'utente utilizza il connettore dati di Google Analytics incorporato di OAC che crea una connessione a Google Drive o Google Analytics. La connessione deve utilizzare gli URI di reindirizzamento autorizzati da Google insieme al segreto client e al nome vista Google Analytics. Dopo l'autorizzazione, puoi leggere la trasformazione e creare i dashboard in OAC.

  • Integrazione Salesforce

    L'adattatore Salesforce consente agli utenti di creare un'integrazione bidirezionale semplificata con Salesforce.com. Consente la ricerca automatica di business object e operazioni e fornisce un mapping semplice ai business object Salesforce.com e viceversa. OIC crea un workflow che crea una connessione con l'adattatore Salesforce, quindi estrae i dati in ADW.

  • Integrazione di Microsoft Azure SQL Server

    L'integrazione dei dati di SQL Server con ADW viene ottenuta mediante Integrazione dati. Crea una pipeline di dati da SQL Server ad ADW, specifica l'asset dati di origine e quindi configura le trasformazioni per pulire ed elaborare i dati mentre vengono caricati nell'asset dati di destinazione. Per eseguire un set specifico di processi in una sequenza, creare una pipeline. La progettazione di una pipeline è simile alla creazione di un flusso di dati, in cui gli operatori utilizzano per aggiungere i task e le attività desiderate. Dopo aver creato una pipeline, si crea un task della pipeline che utilizza la pipeline. Dopo aver creato i task, è possibile pubblicarli nell'applicazione predefinita o nella propria applicazione. Le applicazioni eseguono i task e ne monitorano l'avanzamento e lo stato. È inoltre possibile pianificare i task per le esecuzioni automatiche.

  • Feed dati manuale (file flash)

    Oracle Cloud Infrastructure Object Storage viene utilizzato come area di memorizzazione dei file aziendali, in cui gli utenti aziendali e operativi stavano caricando i file manuali di data feed come obiettivi, previsioni, indicatori cliente mensili e metriche di allineamento della forza lavoro provvisorie. Quando i file di dati sono disponibili nei bucket di Oracle Cloud Infrastructure Object Storage, vengono automaticamente selezionati per l'elaborazione mediante Integrazione dati.

  • Integrazione di Oracle Fusion Service

    OCI Data Integration utilizza Oracle Business Intelligence Cloud Connector (BICC) per abilitare le connessioni a Fusion Applications come origini dati. Utilizzare un asset dati Fusion Applications come origine per estrarre i dati da Fusion Applications, ad esempio un cloud ERP o HCM. OCI Data Integration carica i dati estratti in una posizione di memorizzazione esterna predefinita configurata in BICC. I dati vengono caricati da Fusion Applications a Oracle Cloud Infrastructure Object Storage in formato Parquet e quindi al livello di staging di ADW.

L'architettura è dotata dei componenti elencati di seguito.

  • Tenancy

    Una tenancy è una partizione sicura e isolata che Oracle imposta all'interno di Oracle Cloud quando ti iscrivi a Oracle Cloud Infrastructure. Puoi creare, organizzare e amministrare le tue risorse in Oracle Cloud all'interno della tua tenancy. Una tenancy è sinonimo di azienda o organizzazione. In genere, un'azienda avrà una singola tenancy e ne rifletterà la struttura organizzativa all'interno di tale tenancy. Una singola tenancy in genere è associata a una singola sottoscrizione e una singola sottoscrizione in genere ha una sola tenancy.

  • Area

    Un'area Oracle Cloud Infrastructure è un'area geografica localizzata che contiene uno o più data center, definiti domini di disponibilità. Le regioni sono indipendenti da altre regioni e grandi distanze possono separarle (in tutti i paesi o anche in continenti).

  • Compartimento

    I compartimenti sono partizioni logiche tra più aree all'interno di una tenancy di Oracle Cloud Infrastructure. Usare i compartimenti per organizzare le risorse in Oracle Cloud, controllare l'accesso alle risorse e impostare le quote di utilizzo. Per controllare l'accesso alle risorse in un determinato compartimento, definisci i criteri che specificano chi può accedere alle risorse e quali azioni può eseguire.

  • Autonomous Database

    Oracle Autonomous Database è un ambiente di database preconfigurato e completamente gestito che puoi utilizzare per l'elaborazione delle transazioni e i carichi di lavoro di data warehousing. Non è necessario configurare o gestire hardware né installare software. Oracle Cloud Infrastructure gestisce la creazione del database, nonché il backup, l'applicazione di patch, l'aggiornamento e l'ottimizzazione del database.

  • Analisi

    Oracle Analytics Cloud è un servizio cloud pubblico scalabile e sicuro che offre agli analisti aziendali moderne funzionalità di analitica self-service basate sull'intelligenza artificiale per la preparazione, la visualizzazione, la reportistica aziendale, l'analisi migliorata e l'elaborazione e la generazione del linguaggio naturale. Oracle Analytics Cloud offre anche funzionalità flessibili di gestione dei servizi, tra cui configurazione rapida, scalabilità e applicazione di patch, e gestione automatizzata del ciclo di vita.

  • Storage degli oggetti

    Lo storage degli oggetti garantisce un accesso rapido a grandi quantità di dati strutturati e non strutturati di qualsiasi tipo di contenuto, inclusi backup del database, dati analitici e contenuti avanzati, ad esempio immagini e video. Puoi memorizzare i dati in tutta sicurezza e poi recuperarli direttamente da Internet o dall'interno della piattaforma cloud. Puoi ridimensionare lo storage in modo trasparente senza alcun peggioramento a livello di prestazioni o affidabilità dei servizi. Utilizza lo storage standard per lo storage "hot" a cui devi accedere in modo rapido, immediato e frequente. Utilizzare lo storage di archivio per lo storage "freddo" che si mantiene per lunghi periodi di tempo e raramente può accedere.

  • Domini di disponibilità

    I domini di disponibilità sono data center standalone indipendenti all'interno di un'area geografica. Le risorse fisiche in ciascun dominio di disponibilità sono isolate dalle risorse presenti negli altri domini di disponibilità, che offrono tolleranza agli errori. I domini di disponibilità non condividono l'infrastruttura, ad esempio alimentazione o raffreddamento o la rete interna del dominio di disponibilità. È pertanto improbabile che l'eventuale guasto di un dominio di disponibilità influenzi gli altri domini di disponibilità nell'area.

  • Rete cloud virtuale (VCN) e subnet

    Una VCN è una rete personalizzabile e definita dal software configurata in un'area Oracle Cloud Infrastructure. Analogamente alle reti di data center tradizionali, i VCN offrono il controllo completo sull'ambiente di rete. Una VCN può avere più blocchi CIDR non sovrapposti che puoi modificare dopo aver creato la VCN. Puoi segmentare una VCN nelle subnet che possono essere definite nell'area o in un dominio di disponibilità. Ogni subnet è composta da un intervallo contiguo di indirizzi che non si sovrappongono alle altre subnet nella VCN. Puoi modificare le dimensioni di una subnet dopo la creazione. Una subnet può essere pubblica o privata.

  • Servizi di integrazione OCI

    I servizi di integrazione OCI connettono qualsiasi applicazione e origine dati per automatizzare i processi end-to-end e centralizzare la gestione. L'ampia gamma di integrazioni, con adattatori predefiniti e personalizzazione a basso codice, semplifica la migrazione nel cloud semplificando al contempo le operazioni multicloud.

  • Integrazione applicazioni OCI

    Integrazione delle applicazioni OCI offre connettività predefinita a SaaS e applicazioni on premise, modelli di automazione dei processi run-ready e un visual builder low-code per lo sviluppo di applicazioni Web e mobile. Ti offre l'accesso nativo agli eventi in Oracle Cloud ERP, HCM e CX. Collega i silos analitici specifici dell'applicazione per semplificare il processo dal richiesta al incasso, dal recruiting al pagamento, dal lead alla fattura e altri processi critici, offrendo ai tuoi leader IT e aziendali una visibilità end-to-end.

  • Integrazione dei dati

    Oracle Cloud Infrastructure Data Integration è un servizio completamente gestito, serverless e cloud nativo che estrae, carica, trasforma, pulisce e rimodella i dati da una vasta gamma di origini dati nei servizi Oracle Cloud Infrastructure di destinazione, come Autonomous Data Warehouse e Oracle Cloud Infrastructure Object Storage. ETL (Extract Transform Load; caricamento trasformazione estrazione) sfrutta l'elaborazione scale-out completamente gestita su Spark e ELT (Extract Load Transform) sfrutta le funzionalità push-down SQL complete di Autonomous Data Warehouse per ridurre lo spostamento dei dati e migliorare il time-to-value per i dati appena inclusi. Gli utenti progettano processi di integrazione dei dati utilizzando un'interfaccia utente intuitiva e priva di codice che ottimizza i flussi di integrazione per generare il motore e l'orchestrazione più efficienti, allocando e ridimensionando automaticamente l'ambiente di esecuzione. Oracle Cloud Infrastructure Data Integration offre esplorazione interattiva e preparazione dei dati e aiuta i tecnici dei dati a proteggersi dalle deviazioni degli schemi definendo regole per gestire le modifiche degli schemi.

Conferme

Authors: Parag Pardhi

Contributors: Wei Han, Daryl Eicher, John Sulyok