Daten von YugabyteDB in autonome KI-Transaktionsverarbeitung replizieren

Erfahren Sie, wie Sie Daten aus einer YugabyteDB-Quelle mit OCI GoldenGate in ein Autonomous AI Transaction Processing-Ziel replizieren.

Bevor Sie beginnen

Um diesen Schnellstart erfolgreich abzuschließen, stellen Sie Folgendes sicher:

YugabyteDB einrichten

So richten Sie die YugabyteDB-Instanz ein:
  1. Wenn Sie YugabyteDB mit Oracle Cloud Compute hosten, öffnen Sie Port 5433:
    sudo firewall-cmd --permanent --add-port=5432/tcp
    sudo firewall-cmd --reload 
    sudo firewall-cmd --list-all 
  2. Öffnen Sie Port 5433 in der Sicherheitsliste Ihres VCN.
  3. Stellen Sie eine Verbindung zu YugabyteDB her.
  4. Downlaodieren der Beispieldaten.
  5. Führen Sie die folgenden Befehle aus, um den Benutzer einzurichten. Stellen Sie sicher, dass Sie den Platzhalter <password> durch ein tatsächliches Kennwort ersetzen.
    create user ggadmin with password '<password>'; 
    alter user ggadmin with SUPERUSER; 
    GRANT ALL PRIVILEGES ON DATABASE ociggll TO ggadmin; 

Umgebung eingerichtet: Autonomous AI Transaction Processing (ATP)

  1. Laden Sie das Beispieldatenbankschema herunter, und dekomprimieren Sie es.
  2. Entsperren Sie den GGADMIN-Benutzer.
    1. Wählen Sie in der Oracle Cloud-Konsole auf der Seite "Autonome KI-Datenbank" die ATP-Instanz aus, um die zugehörigen Details anzuzeigen und um auf Database Actions zugreifen zu können.
    2. Klicken Sie auf Database Actions und dann auf Database Users.
    3. Suchen Sie das GGADMIN, klicken Sie dann auf das zugehörige Auslassungsmenü (drei Punkte), und wählen Sie Bearbeiten aus.
    4. Geben Sie im Bereich "Benutzer bearbeiten" das GGADMIN-Passwort ein, bestätigen Sie das Passwort, und heben Sie die Auswahl von Account ist gesperrt auf.
    5. Klicken Sie auf Änderungen anwenden.
  3. Laden Sie das Beispielschema und die Daten des Ziels.
    1. Wählen Sie im Menü "Database Actions" die Option SQL aus.
    2. Kopieren Sie das Skript von OCIGGLL_OCIGGS_SETUP_USERS_ADW.sql, und fügen Sie das Skript in das SQL-Arbeitsblatt hinzu.
    3. Klicken Sie auf Skript ausführen. Auf der Registerkarte "Skriptausgabe" werden Bestätigungsmeldungen angezeigt.
    4. Clear the SQL worksheet and then copy and paste the SQL from OCIGGLL_OCIGGS_SRC_MIRROR_USER_SEED_DATA.sql.
    5. Um zu prüfen, ob die Tabellen erfolgreich erstellt wurden, schließen Sie das SQL-Fenster, und öffnen Sie es erneut. Suchen Sie auf der Registerkarte "Navigator" nach dem Schema SRC_OCIGGLL, und wählen Sie dann Tabellen aus den entsprechenden Dropdown-Listen aus.

Aufgabe 1: OCI GoldenGate-Ressourcen erstellen

Für dieses Schnellstartbeispiel sind Deployments und Verbindungen sowohl für die Quelle als auch für das Ziel erforderlich.
  1. Erstellen Sie ein Deployment für die PostgreSQL-Quelldatenbank.
  2. Erstellen Sie ein Deployment für die Autonomous AI Transaction Processing-Zielinstanz.
  3. Verbindung zur PostgreSQL-Quelldatenbank erstellen.
    1. Stellen Sie unter Typ sicher, dass Sie YugabyteDB auswählen.
    2. Geben Sie unter Datenbankname den YugabyteDB-Namen ein.
    3. Geben Sie unter Host die öffentliche IP der Compute-Instanz ein, auf der YugabyteDB ausgeführt wird.
    4. Geben Sie unter Port die Nummer 5433 ein.
    5. Geben Sie unter Benutzername ggadmin ein.
    6. Geben Sie unter Kennwort ein Kennwort ein.
    7. Wählen Sie unter Sicherheitsprotokoll die Option Nur aus.
  4. Erstellen Sie eine Verbindung für die Autonomous AI Transaction Processing-Zielinstanz.
  5. Erstellen Sie eine Verbindung zu GoldenGate, und weisen Sie diese Verbindung dem PostgreSQL-Quell-Deployment zu.
  6. Weisen sie die Quellverbindung dem PostgreSQL-Quell-Deployment zu.
  7. Weisen Sie die Zielverbindung dem Oracle-Ziel-Deployment zu.

Aufgabe 2: Zusätzliches Logging aktivieren

So aktivieren Sie zusätzliches Logging:
  1. Starten Sie die PostgreSQL GoldenGate-Deployment-Konsole:
    1. Wählen Sie auf der Seite "Deployments" das PostgreSQL-Deployment aus, um die zugehörigen Details anzuzeigen.
    2. Klicken Sie in der PostgreSQL-Deployment-Detailseite auf Konsole starten.
    3. Geben Sie auf der Anmeldeseite der Deployment-Konsole die GoldenGate-Admin-Zugangsdaten ein, die Sie beim Erstellen des Deployments angegeben hatten.

      Hinweis:

      Die Anmeldung ist erforderlich, wenn IAM beim Erstellen eines Deployments nicht als Zugangsdatenspeicher ausgewählt wurde.
  2. Klicken Sie in GoldenGate 26ai in der linken Navigationsleiste auf DB-Verbindungen, dann auf die YugabyteDB-Quelldatenbank und dann auf Trandata.
  3. Klicken Sie auf der Seite "TRANDATA" neben den TRANDATA-Informationen auf TRANDATA hinzufügen (Plussymbol).
  4. Geben Sie im Bereich "Trandata" unter Schemaname src_ociggll.* ein, und klicken Sie auf Weiterleiten.

    Hinweis:

    Verwenden Sie das Suchfeld, um nach src_ociggll zu suchen und zu prüfen, ob die Tabellen hinzugefügt wurden.

Aufgabe 3: Extracts erstellen

  1. Fügen Sie Change Data Capture Extract hinzu:
    1. Klicken Sie in der linken Navigationsleiste auf Extracts,
    2. Klicken Sie auf der Seite Extracts auf Extract hinzufügen (Plussymbol), und füllen Sie die Felder wie folgt aus:
      • Auf der Seite "Daten extrahieren":
        1. Wählen Sie unter Extract-Typ die Option Change Data Capture Extract aus.
        2. Geben Sie unter Prozessname einen Namen für Extract ein, z.B. ECDC.
        3. Klicken Sie auf Weiter.
      • Gehen Sie auf der Seite Extrahierungsoptionen wie folgt vor:
        1. Wählen Sie für Quellzugangsdaten in der Dropdown-Liste Domain die Option Oracle GoldenGate aus
        2. Wählen Sie in der Dropdown-Liste Alias die PostgreSQL-Quelldatenbank aus.
        3. Geben Sie unter Trailname extrahieren einen aus zwei Zeichen bestehendem Trailnamen wie C1 ein.
        4. Klicken Sie auf Weiter.
      • Ersetzen Sie auf der Seite "Parameter" Extract MAP *.*, TARGET *.*; durch Folgendes:
        TABLE SRC_OCIGGLL.*;
    3. Klicken Sie auf Erstellen und ausführen.
  2. Erstmaliges Laden von Extract hinzufügen:
    1. Klicken Sie auf der Seite "Exporte" auf Extrahieren hinzufügen, und füllen Sie das Formular "Extrahieren hinzufügen" wie folgt aus:
      • Auf der Seite mit den Informationen zum Extrahieren:
        1. Wählen Sie für den Typ Extrahieren die Option Erstmaliges Laden Extrahieren aus.
        2. Geben Sie unter Prozessname einen Namen wie EIL ein.
        3. Klicken Sie auf Weiter.
      • Gehen Sie auf der Seite Extrahierungsoptionen wie folgt vor:
        1. Wählen Sie für Quellzugangsdaten in der Dropdown-Liste Domain die Option Oracle GoldenGate aus.
        2. Wählen Sie in der Dropdown-Liste Alias die Option YugabyteDB.
        3. Geben Sie unter Trailname einen aus zwei Zeichen stehenden Trailnamen wie I1 ein.
        4. Klicken Sie auf Weiter.
      • Ersetzen Sie auf der Seite Extrahierungsparameter den Inhalt des Textbereichs durch Folgendes:
        EXTRACT EIL
        USERIDALIAS YugabyteDB_Compute, DOMAIN OracleGoldenGate
        EXTFILE I1, PURGE
        TABLE src_ociggll.*;

        Hinweis:

        Stellen Sie sicher, dass Sie den Parameter SOURCEDB vor USERIDALIAS entfernen, bevor Sie fortfahren.
    2. Klicken Sie auf Erstellen und ausführen.
Sie kehren zur Seite Extracts zurück, auf der Sie den Extract beginnen können.

Aufgabe 4: Distribution Path für Initial Load Extrahieren erstellen

  1. Wählen Sie auf der Seite "Deployments" das Oracle-Deployment Ziel aus.
  2. Klicken Sie auf der Seite "Deployment-Details" auf Konsole starten, und melden Sie sich als Admin-Benutzer an.
  3. Wenn Sie den IAM-Zugangsdatenspeicher verwenden, fahren Sie mit dem Schritt "Distribution Path erstellen" fort. Wenn Sie den GoldenGate-Zugangsdatenspeicher verwenden, erstellen Sie einen Benutzer, mit dem die Quelle GoldenGate eine Verbindung zum GoldenGate-Ziel herstellt.
    1. Klicken Sie im Navigationsmenü auf Benutzeradministration.
    2. Klicken Sie auf Neuen Benutzer hinzufügen (Plussymbol), geben Sie Werte in die Felder ein, und klicken Sie auf Weiterleiten:
      • Geben Sie unter Benutzername ggsnet ein.
      • Wählen Sie unter Rolle die Option Operator aus.
      • Geben Sie das Kennwort zur Bestätigung zweimal ein.
  4. Erstellen Sie in der PostgreSQL-Deployment-Konsole der Quelle eine Pfadverbindung für den im vorherigen Schritt erstellten Benutzer.
    1. Klicken Sie im Navigationsmenü auf Pfadverbindungen.
    2. Klicken Sie auf Pfadverbindung hinzufügen (Plussymbol), geben Sie Werte in die Felder ein, und klicken Sie auf Weiterleiten:
      • Geben Sie als Zugangsdatenalias dpuser ein.
      • Geben Sie unter "Benutzer-ID" ggsnet ein.
      • Geben Sie unter "Kennwort" dasselbe Kennwort ein, das im vorherigen Schritt verwendet wurde.
  5. Erstellen Sie eine Distribution Path.
    1. Klicken Sie in der Servicemenüleiste auf Distribution Service und dann auf Distribution Path hinzufügen (Plussymbol).
    2. Füllen Sie das Formular "Pfad hinzufügen" wie folgt aus:
      • Gehen Sie auf der Seite "Pfadinformationen" wie folgt vor:
        1. Geben Sie unter Pfadname einen Namen für diesen Pfad an.
        2. Klicken Sie auf Weiter.
      • Gehen Sie auf der Seite {\b Source Options} wie folgt vor:
        1. Lassen Sie unter Quelle Extract das Feld leer.
        2. Geben Sie unter Trailname den Trailnamen Initial Load Extract (I1) ein.
        3. Klicken Sie auf Weiter.
      • Gehen Sie auf der Seite "Zieloptionen" wie folgt vor:
        1. Wählen Sie unter Zielprotokoll die Option wss aus.
        2. Geben Sie unter Zielhost die Ziel-Deployment-URL ohne https:// oder abschließende Schrägstriche an.
        3. Geben Sie unter Portnummer 443 ein.
        4. Geben Sie unter Trailname I1 ein.
        5. Wählen Sie unter Zielauthentifizierungsmethode die Option OAuth aus.

          Hinweis:

          Wählen Sie UserID-Alias aus, wenn GoldenGate beim Erstellen eines Deployments als Zugangsdatenspeicher ausgewählt wurde. Wählen Sie andernfalls OAuth aus.
        6. Geben Sie unter Domain den Domainnamen an, der im vorherigen Schritt erstellt wurde.
        7. Geben Sie unter Alias den im vorherigen Schritt erstellten Alias ein (dpuser).
        8. Klicken Sie auf Weiter.
    3. Klicken Sie auf Erstellen und ausführen.
    Sie kehren zur Seite Distribution Service zurück, auf der Sie den erstellten Pfad prüfen können.
  6. Prüfen Sie in der Oracle-Deployment-Konsole des Ziels den Empfangspfad, der als Ergebnis des Verteilungspfades erstellt wurde:
    1. Klicken Sie auf Receiver Service.
    2. Prüfen Sie die Distribution Path-Details.

Aufgabe 5: Replicat für Initial Load hinzufügen

  1. Fügen Sie im Oracle-Deployment Ziel eine Tabelle Checkpoint hinzu.
    1. Klicken Sie im Navigationsmenü auf DB-Verbindungen
    2. Wählen Sie die Autonomous AI Database-Zielinstanz und dann Checkpoints aus.
    3. Klicken Sie auf der Seite Checkpoints auf Checkpoint hinzufügen (Plussymbol).
    4. Geben Sie im Bereich Checkpoint unter Schematabelle SRCMIRROR_OCIGGLL.CHECKTABLE ein.
    5. Klicken Sie auf Weiterleiten.
  2. Fügen Sie Replicat hinzu.
    1. Öffnen Sie das Navigationsmenü, und klicken Sie auf Replicats.
    2. Klicken Sie auf der Seite Replicats auf Replicat hinzufügen (Plussymbol), und füllen Sie die Felder "Replicat hinzufügen" wie folgt aus:
      • Auf der Seite Replicat Information:
        1. Wählen Sie unter Replicat type die Option Nonintegrated Replicat aus.
        2. Geben Sie unter Prozessname einen Namen wie RIL ein.
        3. Klicken Sie auf Weiter
      • Auf der Seite Replicat Optionen:
        1. Geben Sie unter Replicat Trailname den Namen des Trails aus Aufgabe 2 (I1) ein.
        2. Wählen Sie unter Zieldaten die Domain und den Alias für die Autonomous AI Database-Verbindung aus.
        3. Wählen Sie unter Checkpoint-Tabelle die Checkpoint-Tabelle aus, die Sie in Schritt 1 erstellt haben.
        4. Klicken Sie auf Weiter.
      • Ersetzen Sie auf der Seite "Parameterdatei" MAP *.*, TARGET *.*; durch Folgendes:
        MAP SRC_OCIGGLL.*, TARGET SRCMIRROR_OCIGGLL.*;
    3. Klicken Sie auf Erstellen und ausführen.
      Sie kehren zur Seite Replicats zurück, auf der Sie die Replicat-Details prüfen können.
  3. Wählen Sie das Replicat (RIL) aus, und zeigen Sie die zugehörigen Details an.
  4. Klicken Sie auf Statistiken, und prüfen Sie die Anzahl der Einfügevorgänge. Aktualisieren Sie die Seite.
    • Wenn sich die Anzahl der Einfügevorgänge nicht ändert, wurden alle Datensätze aus der Initial Load geladen, und Sie können die Replicat (RIL) stoppen.
    • Wenn die Anzahl der Einfügevorgänge weiter zunimmt, aktualisieren Sie die Seite solange, bis alle Datensätze der Initial Load geladen sind, bevor Sie fortfahren.
  5. Prüfen Sie die Initial Load.
    1. Klicken Sie in der Oracle Cloud-Konsole auf der Detailseite der Autonomous AI Database auf Database actions, und klicken Sie dann auf SQL.
    2. Geben Sie im SQL-Tool jede der folgenden Anweisungen in das Arbeitsblatt ein, und klicken Sie auf Anweisung ausführen:
      SELECT * FROM SRCMIRROR_OCIGGLL.SRC_CITY;
      SELECT * FROM SRCMIRROR_OCIGGLL.SRC_CUSTOMER;
    Die Ausgabe sollte die Daten zurückgeben, die als Ergebnis des Initial Load in die Zieldatenbanktabellen geladen wurden.

Aufgabe 6: Distribution Path für Change Data Capture Extract erstellen

  1. Klicken Sie in der PostgreSQL-Deployment-Konsole der Quelle auf Distribution Service.
  2. Klicken Sie auf Distribution Path hinzufügen.
  3. Füllen Sie das Formular "Pfad hinzufügen" wie folgt aus:
    1. Gehen Sie auf der Seite "Pfadinformationen" wie folgt vor:
      1. Geben Sie unter Pfadname einen Namen ein.
      2. Klicken Sie auf Weiter.
    2. Gehen Sie auf der Seite {\b Source Options} wie folgt vor:
      1. Wählen Sie unter Quelle Extract die Option Change Data Capture Extract (ECDC)) aus.
      2. Wählen Sie unter Trailname die Traildatei Change Data Capture (C1).
      3. Klicken Sie auf Weiter.
    3. Gehen Sie auf der Seite "Zieloptionen" wie folgt vor:
      1. Wählen Sie unter Ziel die Option wss aus.
      2. Geben Sie unter Zielhost die Ziel-Deployment-Konsolen-URL ein (Sie finden diese auf der Seite mit den Deployment-Details ohne https:// oder abschließende Schrägstriche).
      3. Geben Sie unter Portnummer 443 ein.
      4. Geben Sie unter Trailname C1 ein.
      5. Wählen Sie unter Zielauthentifizierungsmethode die Option OAuth aus.

        Hinweis:

        Wählen Sie UserID-Alias aus, wenn GoldenGate beim Erstellen eines Deployments als Zugangsdatenspeicher ausgewählt wurde. Wählen Sie andernfalls OAuth aus.
      6. Geben Sie unter Domain den Domainnamen ein.
      7. Geben Sie unter Alias den Alias ein.
    4. Klicken Sie auf Pfad erstellen und ausführen.
  4. Klicken Sie in der Oracle-Ziel-Deployment-Konsole auf Empfangsservice, und prüfen Sie den erstellten Empfangspfad.

Aufgabe 7: Replicat für Change Data Capture hinzufügen

  1. Fügen Sie in der Oracle-Deployment-Konsole des Ziels eine Replicat hinzu.
    1. Klicken Sie im Navigationsmenü des Administrationsservice auf Replicats.
    2. Klicken Sie auf der Seite Replicats auf "Replicat hinzufügen" (Plussymbol), und füllen Sie das Formular "Replicat hinzufügen" wie folgt aus:
      • Auf der Seite "Replicat-Informationen":
        1. Wählen Sie unter Replicat type die Option Nonintegrated Replicat aus.
        2. Geben Sie unter Prozessname einen Namen wie RCDC ein.
        3. Klicken Sie auf Weiter.
      • Auf der Seite Replicat Optionen:
        1. Geben Sie unter Replicat Trailname den Namen des Trails aus Aufgabe 3 (C1) ein.
        2. Wählen Sie unter Zieldaten die Domain und den Alias für die Autonomous AI Database-Verbindung aus.
        3. Wählen Sie unter Checkpoint-Tabelle die Checkpoint-Tabelle aus.
      • Ersetzen Sie MAP *.*, TARGET *.*; auf der Seite "Replicat-Parameter" durch die folgende Zuordnung:
        MAP SRC_OCIGGLL.*, TARGET SRCMIRROR_OCIGGLL.*;
    3. Klicken Sie auf Create. Führen Sie Replicat nicht aus.
  2. Wählen Sie Replicat für Initial Load (RIL) auf der Seite Replicats aus, und zeigen Sie die zugehörigen Details an.
  3. Klicken Sie auf Statistiken, und prüfen Sie die Anzahl der Einfügevorgänge. Aktualisieren Sie die Seite.
    • Wenn sich die Anzahl der Einfügevorgänge nicht ändert, wurden alle Datensätze aus der Initial Load geladen, und Sie können die Replicat (RIL) stoppen.
    • Wenn die Anzahl der Einfügevorgänge weiter zunimmt, aktualisieren Sie die Seite solange, bis alle Datensätze der erstmaligen Ladungsdatei Initial Load geladen sind, bevor Sie fortfahren.

    Hinweis:

    Wenn keine Einfügungen angezeigt werden, klicken Sie auf Performancemetrikservice, wählen Sie Extrahieren aus, und klicken Sie auf Datenbankstatistiken.
  4. Kehren Sie zur Seite Replicats zurück, und starten Sie das Replicat für Change Data Capture (RCDC).
  5. Nach dem Starten der Datei Replicat für Change Data Capture prüfen Sie Details und Statistiken, um die Anzahl der Einfügevorgänge anzuzeigen.
  6. Replikation prüfen:
    1. Führen Sie das folgende Skript aus, um Einfügungen in die PostgreSQL-Datenbank auszuführen:
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581);
      Insert into src_ociggll.src_city (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002);
    2. Wählen Sie in der Quell-PostgreSQL-Deployment-Konsole die Option Change Data Capture Extract (ECDC) aus, und klicken Sie auf Statistiken. Stellen Sie sicher, dass src_ociggll.src_city 10 Insert-Vorgänge enthält.

      Hinweis:

      Wenn die Extract keine Einfügevorgänge erfasst hat, starten Sie die ECDC Extract neu.
    3. Wählen Sie in der Oracle-Ziel-Deployment-Konsole den Namen Replicat (RCDC), zeigen Sie die zugehörigen Details an, und prüfen Sie Statistiken. Stellen Sie sicher, dass SRCMIRROR_OCIGGLL.SRC_CITY 10 Einfügungen enthält.

Aufgabe 8: Prozesse überwachen und verwalten

  1. Überwachen Sie die Performance.
  2. Verwalten Sie die Traildateien.