Replica i dati dall'elaborazione delle transazioni AI autonoma AI databricks

Questo Quickstart mostra come replicare i dati da Autonomous AI Transaction Processing a Databricks utilizzando OCI GoldenGate.

Prima di iniziare

Per completare correttamente questo avvio rapido, è necessario disporre dei seguenti elementi:

Impostazione dell'ambiente: Autonomous AI Transaction Processing

Se non si dispone già di un database di origine impostato per la replica, è possibile seguire questi passi per caricare uno schema di esempio da utilizzare per questo avvio rapido. Questo Quickstart utilizza Autonomous AI Transaction Processing per il database di origine.

Per impostare l'elaborazione delle transazioni AI autonoma di origine:

  1. Scaricare ed estrarre lo schema di database di esempio.

  2. Nella console di Oracle Cloud, selezionare l'istanza di Autonomous AI Transaction Processing (ATP) dalla pagina Database AI autonomi per visualizzarne i dettagli e accedere a Database Actions.

  3. Sblocca l'utente GGADMIN:

    1. Selezionare Azioni del database, quindi Utenti del database.

    2. Individuare GGADMIN, quindi selezionare il menu con i puntini di sospensione (tre punti) e selezionare Modifica.

    3. Nel pannello Modifica utente immettere la password GGADMIN, confermare la password, quindi deselezionare Account bloccato.

    4. Selezionare Applica modifiche.

  4. Caricare lo schema e i dati di esempio di origine:

    1. Nel menu Azioni database, in Sviluppo, selezionare SQL.

    2. Copiare e incollare lo script da OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql nel foglio di lavoro SQL.

    3. Selezionare Esegui script. Nella scheda Output script vengono visualizzati i messaggi di conferma.

    4. Cancellare il foglio di lavoro SQL, quindi copiare e incollare lo script SQL da OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql.

      Suggerimento: potrebbe essere necessario eseguire ciascuna istruzione separatamente affinché lo strumento SQL esegua correttamente gli script.

    5. Per verificare che le tabelle siano state create correttamente, chiudere la finestra SQL e riaprirla. Nella scheda Navigator, cercare lo schema SRC_OCIGGLL, quindi selezionare le tabelle dai rispettivi elenchi a discesa.

  5. Abilita il log supplementare:

    1. Cancellare il foglio di lavoro SQL.

    2. Immettere l'istruzione seguente, quindi selezionare Esegui istruzione:

      ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;

Task 1: creare le risorse OCI GoldenGate

Questo esempio di avvio rapido richiede distribuzioni e connessioni sia per l'origine che per la destinazione.

  1. Creare una distribuzione Oracle per l'istanza di Autonomous AI Transaction Processing di origine.

  2. Creare una distribuzione di Big Data per i data center di destinazione.

  3. Creare una connessione all'elaborazione delle transazioni AI autonoma di origine.

  4. Creare una connessione a DataBricks.

  5. Creare una connessione per Azure Data Lake Storage.

  6. Creare una connessione a GoldenGate, quindi assegnare questa connessione alla distribuzione Oracle di origine.

  7. Assegnare la connessione Autonomous AI Transaction Processingg alla distribuzione Oracle di origine.

  8. Assegnare la connessione Databricks alla distribuzione dei Big Data di destinazione.

  9. Assegnare la connessione di Azure Data Lake Storage alla distribuzione Big Data di destinazione.

Task 2: Aggiunta dell'estrazione

  1. Nella pagina Distribuzioni selezionare la distribuzione Autonomous AI Transaction Processing di origine.

  2. Nella pagina dei dettagli della distribuzione selezionare Avvia console.

  3. Eseguire il login con nome utente e password dell'amministratore della distribuzione di origine.

  4. Aggiungi un'estrazione.

Task 3: Aggiunta ed esecuzione del percorso di distribuzione

  1. Se si utilizza l'area di memorizzazione delle credenziali GoldenGate, creare un utente per il percorso di distribuzione nella distribuzione dei Big Data destinazione, altrimenti passare al passo 3.

  2. Nella console di distribuzione origine GoldenGate aggiungere una connessione percorso per l'utente creato nel Passo 1.

    1. Nella console di distribuzione GoldenGate di origine, selezionare Connessioni percorso nella navigazione a sinistra.

    2. Selezionare Aggiungi connessione percorso (icona più), quindi completare quanto riportato di seguito.

      1. Per Alias credenziale, immettere GGSNetwork.

      2. In ID utente, immettere il nome dell'utente creato nel Passo 1.

      3. Immettere due volte la password dell'utente per la verifica.

    3. Selezionare Sottometti.

      La connessione al percorso viene visualizzata nell'elenco Connessioni percorso.

  3. Nella console di distribuzione origine, aggiungere un percorso di distribuzione con i valori seguenti:

    1. Nella pagina Opzioni di origine effettuare le operazioni riportate di seguito.

      • Per Estrazione origine, selezionare l'estrazione creata nel task 2.

      • In Nome percorso, immettere un nome di due caratteri, ad esempio E1.

    2. Nella pagina Opzioni di destinazione effettuare le operazioni riportate di seguito.

      • Per Host di destinazione, immettere il dominio host della distribuzione di destinazione.

      • In Numero porta, immettere 443.

      • In Nome percorso, immettere un nome di due caratteri, ad esempio E1.

      • In Alias, immettere l'alias credenziale creato nel Passo 2.

  4. Nella console di distribuzione Big Data destinazione, esaminare il percorso del ricevente creato come risultato del percorso di distribuzione.

    1. Nella console di distribuzione Big Data di destinazione selezionare Servizio ricevente.

    2. Rivedere i dettagli del percorso. Questo percorso è stato creato come risultato del percorso di distribuzione creato nel passo precedente.

Task 4: Aggiungere ed eseguire Replicat

  1. Nella console di distribuzione Big Data di destinazione, selezionare Replicat, quindi selezionare Aggiungi Replicat (icona più).

  2. Aggiungere un Replicat con i valori seguenti:

    1. Nella pagina Informazioni Replicat, in Tipo Replicat, selezionare Replicat classico, immettere un nome di processo, quindi selezionare Successivo.

    2. Nella pagina Opzioni replica:

      • Per Nome, immettere il nome dello trail dal task 2.

      • Per Destinazione, selezionare DataBricks.

      • Per Alias disponibile, selezionare la connessione DataBricks dall'elenco a discesa.

      • Per Posizione area intermedia disponibile, selezionare Azure Data Lake Storage.

      • Per tramite alias temporaneo, selezionare la connessione ADLS.

    3. Nella pagina Opzioni gestite, lasciare l'impostazione predefinita.

    4. Nella pagina File di Paremeter, sostituire MAP *.*, TARGET *.*; con quanto segue e selezionare Successivo:

      MAP SRC_OCIGGLL.SRC_CUSTOMER, TARGET
            <target_catalog_name>.<target_schema_name>.SRC_CUSTOMER
    5. Nella pagina Proprietà file:

      1. Fornire il nome del contenitore ADLS di destinazione in gg.eventhandler.abs.bucketMappingTemplate.

      2. Aggiungere gg.handler.databricks.fileRollInterval=5s.

  3. Selezionare Crea ed esegui.

Si torna alla pagina Panoramica, in cui è possibile rivedere i dettagli di Replicat.

Task 5: Verificare la replica

  1. Nella console di Oracle Cloud, aprire il menu di navigazione, selezionare Oracle AI Database, quindi selezionare Autonomous AI Transaction Processing.

  2. Nell'elenco delle istanze di Autonomous AI Transaction Processing selezionare l'istanza di origine per visualizzarne i dettagli.

  3. Nella pagina dei dettagli del database selezionare Azioni del database.

    Nota: il login deve essere eseguito automaticamente. In caso contrario, eseguire il login con le credenziali del database.

  4. Nella home page Azioni database selezionare SQL.

  5. Immettere quanto segue nel foglio di lavoro e selezionare Esegui script.

  6. Nella console di distribuzione GoldenGate OCI di origine, selezionare il nome Extract, quindi selezionare Statistiche. Verificare che in SRC_OCIGGLL.SRC_CUSTOMER siano presenti 7 inserimenti.

    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1001,0,'Brendt','Paul','10 Jasper Blvd.',107,'(212) 555 2146',19,10);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1002,0,'McCarthy','Robin','27 Pasadena Drive',11,'(214) 555 3075',29,11);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1003,0,'Travis','Peter','7835 Hartford Drive',12,'(510) 555 4448',34,12);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1004,0,'Larson','Joe','87 Carmel Blvd.',13,'(213) 555 5095',45,13);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1005,0,'Goldschmidt','Tony','91 Torre drive',14,'(619) 555 6529',55,20);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1006,0,'Baker','William','2890 Grant Avenue',15,'(312) 555 7040',64,21);
    Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1007,0,'Swenson','Jack','64 Imagination Drive',19,'(202) 555 8125',74,22)
  7. Nella console di distribuzione Big Data OCI GoldenGate di destinazione, selezionare il nome Replicat, quindi selezionare Statistiche. Verificare che in SRC_OCIGGLL.SRC_CUSTOMER siano presenti 7 inserimenti.

Task 6: Monitoraggio e manutenzione dei processi

  1. Monitorare il processo di replica.

  2. Gestisci file trail.