Replicare i dati in Stream Analytics
Impara a replicare i dati da OCI GoldenGate in Stream Analytics.
GoldenGate Stream Analytics è iniziato come un motore di elaborazione di eventi complessi che si è evoluto per eseguire una parte superiore dei framework runtime con Apache Spark e Apache Kafka. Stream Analytics può includere un flusso di dati da qualsiasi origine, ad esempio un database, GoldenGate, Kafka, JMS, REST o anche un file system. Dopo l'inclusione dei dati, è possibile eseguire l'analitica sui dati attivi.
Prima di iniziare
Per completare correttamente questo Quickstart è necessario:
-
Autonomous AI Database di origine con dati di esempio caricati e log supplementare abilitato.
Suggerimento
È possibile scaricare i dati di esempio OCI GoldenGate, se è necessario utilizzare dati di esempio.
-
In primo luogo, modificare
SETUP_USERS_ATP.sqle la password dell'utenteSRC_OCIGGLLper rimuovere i caratteri speciali. -
Utilizzare lo strumento SQL Database Actions di Autonomous AI Database per eseguire i due script per creare lo schema utente e le tabelle.
-
Utilizzare lo strumento SQL per abilitare il log supplementare.
Per ulteriori dettagli, attenersi alla procedura descritta in Lab 1, Task 3: caricare lo schema ATP.
-
-
Sblocca l'utente GGADMIN nell'istanza di Autonomous AI Database di origine
-
Nella pagina Dettagli di Autonomous AI Database, selezionare Utenti database dal menu Azioni del database.
Suggerimento: utilizzare le credenziali di amministratore di Autonomous AI Database fornite al momento della creazione dell'istanza per eseguire il login, se richiesto.
-
Individuare l'utente GGADMIN, quindi selezionare Modifica dal menu con i puntini di sospensione (tre punti).
-
Nel pannello Modifica utente immettere una password, confermare la password, quindi deselezionare Account bloccato.
-
Selezionare Applica modifiche.
-
Task 1: creare le risorse OCI GoldenGate
-
Creare la distribuzione OCI GoldenGate per la replica dei dati.
-
Creare una connessione per il database di origine.
Task 2: Creare le risorse di Stream Analytics
-
Creare la distribuzione Stream Analytics.
-
Creare una connessione Kafka utilizzando l'IP pubblico dell'istanza Kafka e selezionare Testo non codificato per il protocollo di sicurezza.
-
Creare una connessione GoldenGate.
-
Assegnare le connessioni alla distribuzione di Stream Analytics.
Task 3: Creare ed eseguire le pipeline
-
Avviare la console di distribuzione di Stream Analytics.
-
Esaminare le connessioni nella console di distribuzione Stream Analytics.
-
Nella console di distribuzione Stream Analytics, selezionare Catalogo.
-
Nella pagina Catalogo, rivedere l'elenco delle connessioni. Dovresti vedere la connessione GoldenGate, la connessione Autonomous AI Database e la connessione Kafka.
-
-
Avviare il cluster Big Data GoldenGate:
-
Nella console di distribuzione OCI GoldenGate Stream Analytics, selezionare Impostazioni di sistema dal menu utente ossaadmin.
-
Nella finestra di dialogo Impostazione sistema, selezionare Gestisci cluster, quindi espandere Cluster DBG.
-
Selezionare Avvia cluster. Attendere che lo stato del cluster sia In esecuzione, quindi chiudere la finestra di dialogo.
-
-
Aggiornare le credenziali di connessione GoldenGate:
Sebbene la connessione GoldenGate sia disponibile nella console di distribuzione Stream Analytics, le credenziali GoldenGate non vengono trasferite. Aggiornare la password ed eseguire il test della connessione.
-
Selezionare Catalogo, quindi selezionare la connessione GoldenGate.
-
Nella finestra di dialogo Modifica connessione selezionare Successivo.
-
Per Nome utente GG, immettere
oggadmin. -
Per GG Password, selezionare Modifica password, quindi immettere la password fornita quando è stata creata la distribuzione GoldenGate OCI per la replica dei dati nel task 1.
-
Selezionare Test della connessione. In caso di esito positivo, selezionare Salva.
-
-
Utilizzare GoldenGate Extract per creare e avviare GoldenGate Change Data.
Assicurarsi di utilizzare i dettagli di estrazione forniti nel task 1 nella pagina Dettagli dati modifica GG.
-
Aggiornare il nome utente di Autonomous AI Database.
Le connessioni al database vengono create con l'utente predefinito,
ggadmin. Aggiornare il nome utente aSRC_OCIGGLL(se sono stati utilizzati i dati di esempio forniti) per accedere allo schema e alle tabelle corrispondenti.-
Selezionare Catalogo, quindi selezionare la connessione ad Autonomous AI Database.
-
Nella finestra di dialogo Modifica connessione, selezionare Avanti.
-
Per Nome utente, immettere
SRC_OCIGGLL. -
Per Password, immettere la password
SRC_OCIGGLLmodificata nei passi Prima di iniziare all'inizio di questo avvio rapido. -
Selezionare Test della connessione. In caso di esito positivo, selezionare Salva.
-
-
Utilizzare le tabelle di ricerca di Autonomous AI Database per creare riferimenti per clienti e ordini.
-
Utilizzare la connessione Kafka per creare flussi Kafka per clienti e ordini.
-
Utilizzare lo strumento SQL di Autonomous AI Database per eseguire inserimenti nel database di origine.
Ad esempio, è possibile eseguire i seguenti inserimenti:
Insert into SRC_OCIGGLL.SRC_ORDERS (ORDER_ID,STATUS,CUST_ID,ORDER_DATE,CUSTOMER) values (11,'COM',101,to_date('16-AUG-2023','DD-MON-YYYY'),null); Insert into SRC_OCIGGLL.SRC_ORDERS (ORDER_ID,STATUS,CUST_ID,ORDER_DATE,CUSTOMER) values (12,'COM',102,to_date('16-AUG-2023','DD-MON-YYYY'),null); Insert into SRC_OCIGGLL.SRC_ORDERS (ORDER_ID,STATUS,CUST_ID,ORDER_DATE,CUSTOMER) values (13,'COM',103,to_date('16-AUG-2023','DD-MON-YYYY'),null); Insert into SRC_OCIGGLL.SRC_ORDERS (ORDER_ID,STATUS,CUST_ID,ORDER_DATE,CUSTOMER) values (14,'COM',104,to_date('16-AUG-2023','DD-MON-YYYY'),null); Insert into SRC_OCIGGLL.SRC_ORDERS (ORDER_ID,STATUS,CUST_ID,ORDER_DATE,CUSTOMER) values (15,'COM',105,to_date('16-AUG-2023','DD-MON-YYYY'),null); Insert into SRC_OCIGGLL.SRC_ORDERS (ORDER_ID,STATUS,CUST_ID,ORDER_DATE,CUSTOMER) values (16,'COM',106,to_date('16-AUG-2023','DD-MON-YYYY'),null); Insert into SRC_OCIGGLL.SRC_ORDERS (ORDER_ID,STATUS,CUST_ID,ORDER_DATE,CUSTOMER) values (17,'COM',107,to_date('16-AUG-2023','DD-MON-YYYY'),null); Insert into SRC_OCIGGLL.SRC_ORDERS (ORDER_ID,STATUS,CUST_ID,ORDER_DATE,CUSTOMER) values (18,'COM',201,to_date('16-AUG-2023','DD-MON-YYYY'),null); Insert into SRC_OCIGGLL.SRC_ORDERS (ORDER_ID,STATUS,CUST_ID,ORDER_DATE,CUSTOMER) values (19,'COM',202,to_date('16-AUG-2023','DD-MON-YYYY'),null); -
Creare una pipeline che utilizza il flusso Kafka creato nel Passo 8.
-
Aggiungere una fase di query, quindi aggiungere un filtro, per restituire solo gli ordini in cui il CUST_ID del flusso Ordini corrisponde al CUSTID del flusso Clienti.