Informazioni sulle pipeline
Accelera le tue soluzioni di replica dei dati con OCI GoldenGate Pipelines.
Le pipeline OCI GoldenGate ti consentono di configurare flussi di replica dei dati in tempo reale che supportano casi d'uso strategici come analytics, reporting operativo e integrazioni di cloud ibrido. Puoi creare una pipeline per lo streaming dei dati direttamente dai database operativi agli ambienti analitici senza i tradizionali processi ETL (extract, transform, load). Ad esempio, puoi impostare una pipeline per replicare direttamente i dati da Autonomous AI Transaction Processing ad Autonomous AI Lakehouse con una configurazione minima.
Nota: poiché le pipeline sono basate sulle distribuzioni GoldenGate, è possibile che si verifichino tempi di inattività nei momenti in cui si verifica un upgrade della distribuzione.
Informazioni sulle pipeline ZeroETL
ZeroETL è un pattern di progettazione ETL (Extract, Transform and Load) per lo spostamento continuo dei dati basato su metadati. Le pipeline di mirroring ZeroETL eseguono il flusso delle modifiche al database con consapevolezza delle transazioni e le applicano direttamente a un database di destinazione.
I vantaggi derivanti dall'utilizzo delle pipeline ZeroETL Mirror includono:
-
Meno pipeline da creare e gestire: sostituisci processi ETL codificati a mano e pianificazioni fragili con pipeline gestite basate su OCI GoldenGate.
-
Distribuzione più rapida di analytics e applicazioni: i mirror quasi in tempo reale mantengono sincronizzate le destinazioni per dashboard, funzioni AI/ML e microservizi.
-
Migliore qualità e coerenza dei dati: la replica attenta alle transazioni riduce la deviazione e la rielaborazione a valle.
-
Riduzione dei rischi operativi: l'orchestrazione gestita, il monitoraggio e la gestione degli errori riducono la fatica delle chiamate.
-
Standard, sicurezza e governance: le connessioni centralizzate, la gestione delle credenziali e la verificabilità sono in linea con i controlli aziendali.
Di seguito sono riportati alcuni esempi di utilizzo delle pipeline Mirror ZeroETL.
-
Analytics e business intelligence in tempo reale: rispecchia i dati operativi nei database di analytics, come Autonomous AI Lakehouse, per dashboard nuovi senza ETL notturno.
-
Artificial Intelligence (AI)/Machine Learning (ML) e Retrieval Augmented Generation (RAG): mantieni sincronizzate le funzioni tra i database AI autonomi o i database Oracle AI per alimentare l'inferenza a bassa latenza.
-
Struttura di dati delle applicazioni multicloud: Mantieni i dati coerenti in tutte le region e nei cloud per supportare le applicazioni distribuite e i pattern di accesso ai dati regionali.
-
Modernizzazione e migrazione: resisti a un obiettivo sincronizzato durante la migrazione per ridurre i rischi di cutover e i tempi di inattività.
Creare risorse pipeline per iniziare.
Concetti sulla pipeline
I seguenti concetti sono essenziali per l'utilizzo delle pipeline:
-
Pipeline: un componente predefinito che consente lo spostamento dei dati in tempo reale e a latenza minima da un database operativo di origine a un lakehouse o a una piattaforma di analytics di destinazione senza la necessità di passi ETL tradizionali.
-
Tipo di pipeline: caso d'uso comune per la replica dei dati.
-
Acquisisci: un processo che viene eseguito sulla connessione di origine ed estrae o acquisisce dati. Conosciuto anche come processo di estrazione.
-
Applica: un processo che fornisce dati a un database o a una tecnologia di destinazione, altrimenti noto come processo Replicat.
Tipi di connessione supportati per le pipeline
Le pipeline GoldenGate OCI attualmente supportano i database Oracle seguenti:
È inoltre possibile creare una connessione nel workflow Crea pipeline.