Daten von der autonomen KI-Transaktionsverarbeitung in Databricks replizieren
Dieser Schnellstart zeigt, wie Sie mit OCI GoldenGate Daten von Autonomous AI Transaction Processing in Databricks replizieren.
Bevor Sie beginnen
Um diesen Schnellstart erfolgreich abzuschließen, benötigen Sie Folgendes:
-
Autonome KI-Transaktionsverarbeitungsinstanz einer Quelle
-
Databricks Workspace mit Unity Catalog
-
Zugangsdaten für den Zugriff auf Azure Storage-Account speichern
-
In Zielkatalog verfügbares Schema
-
Databricks für Zugriffstoken
Umgebung eingerichtet: Autonome KI-Transaktionsverarbeitung
Wenn noch keine Quelldatenbank für die Replikation eingerichtet ist, können Sie mit den folgenden Schritten ein Beispielschema laden, das für diesen Schnellstart verwendet werden soll. Dieser Schnellstart verwendet die autonome KI-Transaktionsverarbeitung für die Quelldatenbank.
So richten Sie die autonome KI-Quelltransaktionsverarbeitung ein:
-
Laden Sie das Beispieldatenbankschema herunter, und dekomprimieren Sie es.
-
Wählen Sie in der Oracle Cloud-Konsole Ihre Autonomous AI Transaction Processing-(ATP-)Instanz auf der Seite "Autonome KI-Datenbanken" aus, um ihre Details anzuzeigen und auf Database Actions zuzugreifen.
-
Entsperren Sie den GGADMIN-Benutzer:
-
Wählen Sie Database actions aus, und wählen Sie Database Users aus.
-
Suchen Sie GGADMIN, und wählen Sie das zugehörige Auslassungsmenü (drei Punkte) aus, und wählen Sie Bearbeiten aus.
-
Geben Sie im Bereich "Benutzer bearbeiten" das GGADMIN-Passwort ein, bestätigen Sie das Passwort, und heben Sie die Auswahl von Account ist gesperrt auf.
-
Wählen Sie Apply Changes aus.
-
-
Laden Sie die Beispielschemas und -daten der Quelle:
-
Wählen Sie im Menü "Datenbankaktionen" unter "Entwicklung" die Option SQL aus.
-
Kopieren Sie das Skript von
OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql, und fügen Sie das Skript in das SQL-Arbeitsblatt hinzu. -
Wählen Sie Skript ausführen aus. Auf der Registerkarte "Skriptausgabe" werden Bestätigungsmeldungen angezeigt.
-
Löschen Sie das SQL-Arbeitsblatt, kopieren Sie das SQL-Skript aus
OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql., und fügen Sie es ein.Tipp: Möglicherweise müssen die einzelnen Anweisungen separat ausgeführt werden, damit das SQL-Tool die Skripte erfolgreich ausführen konnte.
-
Um zu prüfen, ob die Tabellen erfolgreich erstellt wurden, schließen Sie das SQL-Fenster, und öffnen Sie es erneut. Suchen Sie in der Registerkarte "Navigator" nach dem Schema
SRC_OCIGGLL, und wählen Sie dann Tabellen aus dem entsprechenden Dropdown-Listen.
-
-
Aktivieren Sie zusätzliches Logging:
-
Leeren Sie das SQL-Arbeitsblatt.
-
Geben Sie die folgende Anweisung ein, und wählen Sie Anweisung ausführen aus:
ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;
-
Aufgabe 1: OCI GoldenGate-Ressourcen erstellen
Für dieses Schnellstartbeispiel sind Deployments und Verbindungen sowohl für die Quelle als auch für das Ziel erforderlich.
-
Erstellen Sie ein Oracle-Deployment für die Autonomous AI Transaction Processing-Quellinstanz.
-
Erstellen Sie ein Big Data Deployment für die Zieldatabricks.
-
Erstellen Sie eine Verbindung zur autonomen AI-Quelltransaktionsverarbeitung.
-
Erstellen Sie eine Verbindung zu GoldenGate, und weisen Sie diese Verbindung dem Oracle-Quell-Deployment zu.
-
Weisen Sie die Verbindung zur autonomen KI-Transaktionsverarbeitung dem Quell-Oracle-Deployment zu.
-
Weisen Sie dem Big Data-Ziel-Deployment eine Databricks-Verbindung zu.
-
Weisen Sie der Big Data-Zielbereitstellung eine Azure Data Lake Storage-Verbindung zu.
Aufgabe 2: Extract hinzufügen
-
Wählen Sie auf der Seite "Deployments" das Autonomous AI Transaction Processing-Quell-Deployment.
-
Wählen Sie auf der Seite "Deployment-Details" die Option Konsole starten.
-
Melden Sie sich mit dem Benutzernamen und Kennwort des Quell-Deployment-Administrators an.
Aufgabe 3: Verteilungspfad hinzufügen und ausführen
-
Wenn Sie den GoldenGate-Zugangsdatenspeicher verwenden, erstellen Sie einen Benutzer für den Verteilungspfad im Big Data-Deployment des Ziels, oder fahren Sie mit Schritt 3 fort.
-
Fügen Sie in der GoldenGate-Deployment-Konsole der Quelle eine Pfadverbindung für den in Schritt 1 erstellten Benutzer hinzu.
-
Wählen Sie in der GoldenGate-Deployment-Konsole der Quelle in der linken Navigationsleiste Pfadverbindungen aus.
-
Wählen Sie Pfadverbindung hinzufügen (Plussymbol), und führen Sie die folgenden Schritte aus:
-
Geben Sie unter Zugangsdatenalias
GGSNetworkein. -
Geben Sie unter Benutzer-ID den Namen des in Schritt 1 erstellten Benutzers an.
-
Geben Sie das Kennwort des Benutzers zur Bestätigung zweimal ein.
-
-
Klicken Sie auf Weiterleiten.
Die Pfadverbindung wird in der Liste "Pfadverbindungen" angezeigt.
-
-
Fügen Sie in der Quell-Deployment-Konsole einen Verteilungspfad mit den folgenden Werten hinzu:
-
Gehen Sie auf der Seite Quelloptionen wie folgt vor:
-
Wählen Sie unter Quell-Extract den in Aufgabe 2 erstellten Extract.
-
Geben Sie unter Trailname einen aus zwei Zeichen bestehendem Namen wie
E1ein.
-
-
Gehen Sie auf der Seite Zieloptionen wie folgt vor:
-
Geben Sie unter Zielhost die Hostdomain des Ziel-Deployments an.
-
Geben Sie unter Portnummer
443ein. -
Geben Sie unter Trailname einen aus zwei Zeichen bestehendem Namen wie
E1ein. -
Geben Sie unter Alias den in Schritt 2 erstellten Zugangsdatenalias ein.
-
-
-
Prüfen Sie in der Big Data-Deployment-Konsole des Ziels den Empfangspfad, der als Ergebnis des Verteilungspfades erstellt wurde.
-
Wählen Sie in der Big Data-Zielbereitstellungskonsole die Option Receiver Service aus.
-
Prüfen Sie die Pfaddetails. Dieser Pfad wurde als Ergebnis des im vorherigen Schritt erstellten Verteilungspfads erstellt.
-
Aufgabe 4: Replicat hinzufügen und ausführen
-
Wählen Sie in der Big Data-Zielbereitstellungskonsole die Option Replikate, Replicat hinzufügen (Plussymbol) aus.
-
Fügen Sie ein Replicat hinzu mit den folgenden Werten:
-
Wählen Sie auf der Seite "Replicat-Informationen" unter "Replicat-Typ" die Option Classic Replicat aus, geben Sie einen Prozessnamen ein, und wählen Sie Weiter aus.
-
Führen Sie auf der Seite "Replikationsoptionen" folgende Schritte aus:
-
Geben Sie unter Name den Namen des Trails aus Aufgabe 2 ein.
-
Wählen Sie unter Ziel Databricks aus.
-
Wählen Sie unter Verfügbarer Alias in der Dropdown-Liste die Databricks-Verbindung aus.
-
Wählen Sie unter Verfügbarer Staging-Speicherort die Option "Azure Data Lake Storage" aus.
-
Wählen Sie unter über Staging-Alias die ADLS-Verbindung aus.
-
-
Übernehmen Sie auf der Seite "Verwaltete Optionen" die Standardeinstellung.
-
Ersetzen Sie auf der Seite "Paremeter-Datei"
MAP *.*, TARGET *.*;durch Folgendes, und wählen Sie Weiter:MAP SRC_OCIGGLL.SRC_CUSTOMER, TARGET <target_catalog_name>.<target_schema_name>.SRC_CUSTOMER -
Gehen Sie auf der Seite {\b Properties File} wie folgt vor:
-
Geben Sie den ADLS-Zielcontainernamen in
gg.eventhandler.abs.bucketMappingTemplatean. -
Fügen Sie
gg.handler.databricks.fileRollInterval=5shinzu.
-
-
-
Wählen Sie Erstellen und ausführen aus.
Kehren Sie zur Seite "Überblick" zurück, auf der Sie die Replicat-Details prüfen können.
Aufgabe 5: Replikation prüfen
-
Öffnen Sie in der Oracle Cloud-Konsole das Navigationsmenü, wählen Sie Oracle AI Database aus, und wählen Sie Autonomous AI Transaction Processing aus.
-
Wählen Sie in der Liste der Autonomous AI Transaction Processing-Instanzen Ihre Quellinstanz aus, um deren Details anzuzeigen.
-
Wählen Sie auf der Seite mit den Datenbankdetails die Option Database Actions aus.
Hinweis: Die Anmeldung sollte automatisch erfolgen. Andernfalls melden Sie sich mit den Datenbankzugangsdaten an.
-
Wählen Sie auf der Homepage von Database Actions SQL aus.
-
Geben Sie Folgendes in das Arbeitsblatt ein und wählen Sie Skript ausführen.
-
Wählen Sie in der GoldenGate-OCI GoldenGate-Deployment-Konsole für die Quelle den Extract-Namen und dann Statistiken aus. Prüfen Sie, ob SRC_OCIGGLL.SRC_CUSTOMER 7 Einfügungen enthält.
Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1001,0,'Brendt','Paul','10 Jasper Blvd.',107,'(212) 555 2146',19,10); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1002,0,'McCarthy','Robin','27 Pasadena Drive',11,'(214) 555 3075',29,11); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1003,0,'Travis','Peter','7835 Hartford Drive',12,'(510) 555 4448',34,12); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1004,0,'Larson','Joe','87 Carmel Blvd.',13,'(213) 555 5095',45,13); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1005,0,'Goldschmidt','Tony','91 Torre drive',14,'(619) 555 6529',55,20); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1006,0,'Baker','William','2890 Grant Avenue',15,'(312) 555 7040',64,21); Insert into SRC_OCIGGLL.SRC_CUSTOMER (CUSTID,DEAR,LAST_NAME,FIRST_NAME,ADDRESS,CITY_ID,PHONE,AGE,SALES_PERS_ID) values (1007,0,'Swenson','Jack','64 Imagination Drive',19,'(202) 555 8125',74,22) -
Wählen Sie in der Ziel-Big Data-OCI GoldenGate-Deployment-Konsole den Replicat-Namen aus, und wählen Sie Statistiken aus. Prüfen Sie, ob SRC_OCIGGLL.SRC_CUSTOMER 7 Einfügungen enthält.