Daten von Autonomous Transaction Processing in Apache Iceberg replizieren

Erfahren Sie, wie Sie Daten von Autonomous Transaction Processing in Apache Iceberg in OCI GoldenGate replizieren.

Bevor Sie beginnen

Um diesen Schnellstart erfolgreich abzuschließen, benötigen Sie:

  • Eine Autonomous Transaction Processing-Quelle
  • Eine Apache Iceberg-Zielumgebung:
    • OCI GoldenGate unterstützt Azure Data Lake Storage, Amazon S3 und Google Cloud Storage als Speicherservices für Apache Iceberg-Tabellen.
    • OCI GoldenGate unterstützt Hadoop, Nessie, AWS Glue, Polaris, REST und JDBC-Kataloge für Apache Iceberg.

Umgebung eingerichtet: Autonomous Transaction Processing

Wenn noch keine Quelldatenbank für die Replikation eingerichtet ist, können Sie mit den folgenden Schritten ein Beispielschema laden, das für diesen Schnellstart verwendet werden soll. Dieser Schnellstart verwendet Autonomous Transaction Processing für die Quelldatenbank.

So richten Sie die autonome Quelldatenbank ein:

  1. Laden Sie das Beispieldatenbankschema herunter, und dekomprimieren Sie es.
  2. Wählen Sie in der Oracle Cloud-Konsole auf der Seite "Autonome Datenbanken" die Autonomous Transaction Processing-(ATP-)Instanz aus, um ihre Details anzuzeigen und auf Database Actions zuzugreifen.
  3. Entsperren Sie den GGADMIN-Benutzer:
    1. Klicken Sie auf Database Actions und dann auf Database Users.
    2. Suchen sie GGADMIN, klicken Sie dann auf das zugehörige Auslassungsmenü (drei Punkte), und wählen Sie Bearbeiten aus.
    3. Geben Sie im Bereich "Benutzer bearbeiten" das GGADMIN-Passwort ein, bestätigen Sie das Passwort, und heben Sie die Auswahl von Account ist gesperrt auf.
    4. Klicken Sie auf Änderungen anwenden.
  4. Laden Sie die Beispielschemas und -daten der Quelle:
    1. Klicken Sie im Menü "Datenbankaktionen" unter "Entwicklung" auf SQL.
    2. Kopieren Sie das Skript von OCIGGLL_OCIGGS_SETUP_USERS_ATP.sql, und fügen Sie das Skript in das SQL-Arbeitsblatt hinzu.
    3. Klicken Sie auf Skript ausführen. Auf der Registerkarte "Skriptausgabe" werden Bestätigungsmeldungen angezeigt.
    4. Löschen Sie das SQL-Arbeitsblatt, kopieren Sie das SQL-Skript aus OCIGGLL_OCIGGS_SRC_USER_SEED_DATA.sql., und fügen Sie es ein.

      Tipp:

      Möglicherweise müssen Sie jede Anweisung separat ausführen, damit das SQL-Tool die Skripte erfolgreich ausführen kann.
    5. Um zu prüfen, ob die Tabellen erfolgreich erstellt wurden, schließen Sie das SQL-Fenster, und öffnen Sie es erneut. Suchen Sie in der Registerkarte "Navigator" nach dem Schema SRC_OCIGGLL, und wählen Sie dann Tabellen aus dem entsprechenden Dropdown-Listen.
  5. Aktivieren Sie zusätzliches Logging:
    1. Leeren Sie das SQL-Arbeitsblatt.
    2. Geben Sie die folgende Anweisung an, und klicken Sie auf Anweisung ausführen:
      ALTER PLUGGABLE DATABASE ADD SUPPLEMENTAL LOG DATA;

Aufgabe 1: Ressourcen erstellen

Für dieses Schnellstartbeispiel sind Deployments und Verbindungen sowohl für die Quelle als auch für das Ziel erforderlich.

  1. Erstellen Sie ein Oracle-Deployment für die Autonomous Transaction Processing-Quellinstanz.
  2. Erstellen Sie ein Big Data-Deployment für das Apache Iceberg-Ziel.
  3. Autonomous Transaction Processing-Verbindung erstellen.
  4. Apache Iceberg-Verbindung erstellen.
  5. Erstellen Sie eine GoldenGate-Serververbindung, und weisen Sie sie dem Oracle-Deployment zu.
  6. Weisen sie die ATP-Verbindung dem Oracle-Deployment zu.
  7. Weisen sie die Iceberg-Verbindung zum Big Data-Deployment zu.

Aufgabe 2: Extract Extract hinzufügen

  1. Wählen Sie auf der Seite "Deployments" das Autonomous Transaction Processing-Quell-Deployment aus.
  2. Klicken Sie auf der Seite "Deployment-Details" auf Konsole starten.
  3. Melden Sie sich mit dem Benutzernamen und Kennwort des Quell-Deployment-Administrators an.
  4. Fügen Sie Transaktionsinformationen hinzu.
  5. Fügen Sie eine Extract hinzu.

Aufgabe 3: Distribution Path hinzufügen und ausführen

  1. Wenn Sie den Zugangsdatenspeicher GoldenGate verwenden, erstellen Sie einen Benutzer für den Verteilungspfad im Big Data-Deployment des Ziels, oder fahren Sie mit Schritt 3 fort.
  2. Fügen Sie auf der Quell-Deployment-Konsole GoldenGate für die ATP-Quelle eine Pfadverbindung für den in Schritt 1 erstellten Benutzer hinzu.
    1. Klicken Sie in der Deployment-Konsole der ATP-Quell-GoldenGate in der linken Navigationsleiste auf Pfadverbindungen.
    2. Klicken Sie auf Pfadverbindung hinzufügen (Plussymbol), und führen Sie die folgenden Schritte aus:
      1. Geben Sie unter Zugangsdatenalias GGSNetwork ein.
      2. Geben Sie unter Benutzer-ID den Namen des in Schritt 1 erstellten Benutzers an.
      3. Geben Sie das Kennwort des Benutzers zur Bestätigung zweimal ein.
    3. Klicken Sie auf Weiterleiten.

      Die Pfadverbindung wird in der Liste "Pfadverbindungen" angezeigt.

  3. Fügen Sie in der ATP-Deployment-Konsole der Quelle einen Verteilungspfad mit den folgenden Werten hinzu:
    1. Auf der Seite Quelloptionen:
      • Wählen Sie unter Quell-Extract den in Aufgabe 2 erstellten Extract.
      • Geben Sie unter Trailname einen aus zwei Zeichen bestehendem Namen wie E1 ein.
    2. Auf der Seite Zieloptionen:
      • Geben Sie unter Zielhost die Hostdomain des Ziel-Deployments an.
      • Geben Sie unter Portnummer 443 ein.
      • Geben Sie unter Trailname einen aus zwei Zeichen bestehendem Namen wie E1 ein.
      • Geben Sie unter Alias den in Schritt 2 erstellten Zugangsdatenalias ein.
  4. Prüfen Sie in der Big Data-Deployment-Konsole des Ziels den Receiver Path, der als Ergebnis der Distribution Path erstellt wurde.
    1. Klicken Sie in der Big Data-Zielbereitstellungskonsole auf Receiver Service.
    2. Prüfen Sie die Pfaddetails. Dieser Pfad wurde als Ergebnis des im vorherigen Schritt erstellten Distribution Path erstellt.

Aufgabe 4: Replicat hinzufügen und ausführen

So fügen Sie ein Replicat hinzu und führen es aus:
  1. Klicken Sie in der OCI GoldenGate-Deployment-Konsole auf der Administrationsservice-Homepage auf Replicat hinzufügen (Plussymbol).
  2. Füllen Sie im Bereich "Replikat hinzufügen" auf der Seite Replicat-Informationen die Felder nach Bedarf aus, und klicken Sie auf Weiter:
    • Wählen Sie unter Replikattyp die Option "Klassisch" Replikat aus.
    • Geben Sie einen Prozessnamen ein, der nicht länger als 5 Zeichen ist.
    • Geben Sie eine Beschreibung ein, um diesen Prozess von anderen zu unterscheiden.
  3. On the Replicat Options page, complete the fields as needed, and then click Next:
    1. Geben Sie unter Replicat-Trail den Extract-Trailnamen ein.
    2. Wählen Sie unter Ziel die Option Apache Iceberg aus.
    3. Wählen Sie unter Format das Format aus, das Sie in Apache Iceberg aufnehmen möchten. Die Standardeinstellung ist "Parkett".
    4. Wählen Sie unter Verfügbarer Alias in der Dropdown-Liste die Apache Iceberg-Verbindung aus.
  4. Behalten Sie auf der Seite "Verwaltete Optionen" die Standardeinstellungen bei, und klicken Sie auf Weiter.
  5. Behalten Sie die Standardeinstellungen auf der Seite "Replicat-Parameter" bei und klicken Sie auf Weiter.
  6. Aktualisieren Sie auf der Seite "Replicat-Eigenschaften" die markierten Felder TODO, und klicken Sie auf Erstellen und ausführen.
    Weitere Informationen finden Sie unter Apache Iceberg-Zieldetails.

Aufgabe 5: Replikation prüfen

Um die Replikation zu prüfen, führen Sie Updates für die ATP-Quellinstanz aus.
  1. Öffnen Sie in der Oracle Cloud-Konsole das Navigationsmenü, und wählen Sie Oracle Database aus. Wählen Sie dann Autonomous Database aus.
  2. Wählen Sie in der Liste der autonomen Datenbanken Ihre Quellinstanz aus, um deren Details anzuzeigen.
  3. Klicken Sie in der Seite "Datenbankdetails" auf Datenbankaktionen.
  4. Wählen Sie SQL auf der Seite "Datenbankaktionen" aus.
  5. Geben Sie die folgenden Insert-Anweisungen in das SQL-Arbeitsblatt ein, und klicken Sie auf Skript ausführen:
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1000,'Houston',20,743113);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1001,'Dallas',20,822416);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1002,'San Francisco',21,157574);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1003,'Los Angeles',21,743878);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1004,'San Diego',21,840689);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1005,'Chicago',23,616472);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1006,'Memphis',23,580075);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1007,'New York City',22,124434);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1008,'Boston',22,275581);
    Insert into SRC_OCIGGLL.SRC_CITY (CITY_ID,CITY,REGION_ID,POPULATION) values (1009,'Washington D.C.',22,688002);
  6. Wählen Sie in der Konsole für das ATP-Deployment für die Quelle den Extract-Namen, und klicken Sie auf Statistiken. Stellen Sie sicher, dass SRC_OCIGGLL.SRC_CITY 10 Einfügevorgänge enthält.
  7. Wählen Sie in der Big Data-Zielbereitstellungskonsole den Replicat-Namen aus, und klicken Sie auf Statistiken. Stellen Sie sicher, dass SRC_OCIGGLL.SRC_CITY 10 Einfügevorgänge enthält.