Dataloads erstellen und ausführen

Mit einem Dataload können Sie mehrere Datenentitys aus einer Quellverbindung in eine Zielverbindung laden.

Themen

Dataload erstellen

Mit dem Assistenten zum Erstellen von Dataloads können Sie die Quellverbindung und die Zielverbindung für den Dataload definieren.

Hinweis

Dataload wird für Oracle Object Storage-Verbindungen nicht unterstützt.

Mit dem Assistenten können Sie auch die Ladeverarbeitungsoption basierend auf dem Deployment-Typ auswählen. Der neu erstellte Dataload wird auf der Seite "Dataloads" des zugehörigen Projekts angezeigt. Klicken Sie auf das Symbol "Aktionen" (Symbol "Aktionen") neben dem ausgewählten Dataload, um ihn zu bearbeiten, umzubenennen, zu starten, zu exportieren oder zu löschen.

So erstellen Sie einen Dataload von der Homepage:

  1. Führen Sie einen der folgenden Schritte aus:
    • Klicken Sie auf der Homepage auf Daten laden. Der Assistent zum Erstellen von Dataloads wird angezeigt.

      Geben Sie auf der Registerkarte "Dataload erstellen" einen Namen ein, wenn Sie den Standardwert ersetzen, eine Beschreibung hinzufügen und ein Projekt aus der Dropdown-Liste auswählen möchten.

    • Klicken Sie auf der Homepage auf Projekte, und klicken Sie dann auf die erforderliche Projektkachel. Klicken Sie im linken Bereich auf Dataloads und dann auf Dataload erstellen.

    Der Assistent zum Erstellen von Dataloads wird angezeigt.

  2. Geben Sie im Feld "Name" einen Namen für den Dataload ein. Das Feld wird vorab mit einem Standardnamen ausgefüllt. Dieser Wert kann bearbeitet werden.
  3. Fügen Sie eine Beschreibung ein. Diese Option ist optional.
  4. Wenn Sie den Assistenten zum Erstellen von Dataloads auf der Homepage geöffnet haben, müssen Sie einen Projektnamen aus der Dropdown-Liste auswählen. Wenn dies Ihr erstes Mal hier ist, klicken Sie auf das +-Symbol, um ein Projekt zu erstellen. Wenn Sie sich als SUPERVISOR angemeldet haben, lautet der Standardprojektname Home. Für andere Benutzer hat der Standardprojektname das Format <username>_Home. Der Standardwert kann bearbeitet werden. Weitere Informationen zu Projekten finden Sie unter Mit Projekten arbeiten.
  5. Führen Sie unter Ladeverarbeitung einen der folgenden Schritte aus:
    • Aktivieren Sie das Optionsfeld Intern, und wählen Sie in der Dropdown-Liste Deployment-Typ die Option Datentransformationen (Batch) aus.
    • Aktivieren Sie das Optionsfeld Delegieren, und wählen Sie in der Dropdown-Liste Deployment-Typ die Option "OCI GoldenGate" aus. Wählen Sie im Dropdown-Menü GoldenGate-Deployment-Verbindung eine Verbindung aus.
  6. Klicken Sie auf Weiter.
  7. Um die Quellverbindung zu definieren, wählen Sie in der Dropdown-Liste Verbindung die erforderliche Verbindung aus, aus der Sie die Datenentitys hinzufügen möchten. Alternativ können Sie auf das Symbol "+" klicken, um eine neue Verbindung zu erstellen. Weitere Informationen zu Verbindungen finden Sie unter Mit Verbindungen arbeiten.
  8. In der Dropdown-Liste Schema werden alle Schemas, die der ausgewählten Verbindung entsprechen, in zwei Gruppen aufgeführt:
    • Vorhandenes Schema (Eins, das Sie in Oracle Data Transforms importiert haben) und
    • Neues Datenbankschema (Eins, das Sie noch nicht importiert haben).
    Wählen Sie in der Dropdown-Liste das Schema aus, das Sie verwenden möchten.
    Hinweis

    Wenn Informationen wie Benutzername oder Kennwort nicht angegeben sind, das Wallet fehlt usw., kann die Liste möglicherweise nicht mit dem Fehler "Diese Verbindung enthält fehlende Informationen." aufgefüllt werden. Klicken Sie auf das Bearbeitungssymbol (Symbol "Bearbeiten"), um die Seite "Verbindung aktualisieren" zu öffnen, auf der Sie die fehlenden Details eingeben können.
  9. Klicken Sie auf Weiter.
  10. Definieren Sie die Zielverbindung ebenfalls. Wenn Sie eine Apache Iceberg-Verbindung als Ziel zum Laden von Daten verwenden möchten, finden Sie weitere Anweisungen unter Apache Iceberg Data Load erstellen und ausführen.
  11. Klicken Sie auf Speichern.

    Die Seite "Detail für Dataload" wird mit allen geladenen Datenentitys angezeigt.

Dataload ausführen

Nachdem Sie den Dataload erstellt haben, gelangen Sie zur Seite "Detail für Dataload", auf der die Details angezeigt werden, die Sie zum Ausführen eines Dataloads benötigen.

Sie enthält die Details des Quellschemas, die Datenentitys, die aus dem Quellschema geladen werden, und die Details des Zielschemas. Sie können die Aktion auswählen, die Sie für jede Datenentity anwenden möchten: Tabellen im Bulkverfahren neu erstellen, abschneiden, anhängen und im Zielschema laden. Wenn Sie einen Dataload ausführen, werden mehrere Jobs im Hintergrund ausgeführt, um die Anforderung abzuschließen.

Sie können einen Dataload auf eine der folgenden Arten ausführen:

Hinweis

Dataload wird für Oracle Object Storage-Verbindungen nicht unterstützt.

Dataload auf der Seite "Detail für Dataload" ausführen

Auf der Seite "Detail für Dataload" werden die Informationen angezeigt, die Sie zum Ausführen eines Dataloads benötigen. Sie können verschiedene Aktionen (inkrementelle Zusammenführung, inkrementelles Anhängen, Neuerstellen, Abschneiden, Anhängen) auf die Datenentitys anwenden, bevor Sie sie in das Zielschema laden.

Hinweis

Gilt für: Anwendbar Datentransformationen, die als separate Listung im Marketplace mit der Bezeichnung Data Integrator: Web Edition verfügbar sind.

Wenn der Dataload groß ist, können Sie den Arbeitsspeicher des ODI-Agents erhöhen, um Probleme zu vermeiden. Befolgen Sie die Anweisungen unter Speicher von ODI-Agent erhöhen, bevor Sie mit der Ausführung des Dataloads beginnen.

So führen Sie einen Dataload über die Dataload-Detailseite aus:

  1. Wählen Sie auf der Seite "Detail für Dataload" die Datenentitys aus, die Sie in das Zielschema verschieben möchten.
    Zum Filtern der Liste können Sie eine der folgenden Aktionen ausführen:
    • Geben Sie den Namen oder einen Teil des Namens in das Textfeld Name ein. Diese Suche gibt Datenentitys zurück, die den angegebenen String im Namen enthalten. Beispiel: Die Suchzeichenfolge AD gibt Ergebnisse wie ADMIN, ADDRESS, BADGE, UPGRADE, WORKLOAD usw. zurück.
    • Aktivieren Sie den Schalter Regulären Ausdruck verwenden, um den Musterabgleich zu verwenden, um nach bestimmten Zeichenfolgen zu suchen. Beispiel: Die Suchzeichenfolge CO.* gibt Ergebnisse wie CONTACT, COUNT, COUNTRY usw. zurück.
    Sie können mehrere Datenentitys auswählen und in das Zielschema laden. Sie können die angezeigte Liste auch mit den folgenden Optionen sortieren:
    • Alle - Zeigt alle Datenentitys an, die den Suchkriterien entsprechen.
    • Ausgewählt - Zeigt alle ausgewählten Zeilen an.
    • Unselected (Nicht ausgewählt) – Alle nicht ausgewählten Zeilen werden angezeigt.
    • Invalid (Ungültig) – Zeigt alle ungültigen Zeilen an.
    Hinweis

    Diese Optionen zeigen die Liste der Datenentitys basierend auf den Suchkriterien an. Um die Liste aller Datenentitys anzuzeigen, löschen Sie alle angewendeten Filter.
  2. Klicken Sie auf das gewünschte Symbol, um eine der folgenden Aktionen auszuwählen:
    • Inkrementelle Zusammenführung - Aktualisiert die Daten in der ausgewählten Spalte, indem die Quelltabelle mit der Zieltabelle basierend auf dem angegebenen Zusammenführungsschlüssel verglichen wird. Um diese Option zu verwenden, wählen Sie die Spalte aus, die Sie zusammenführen möchten, und dann den Zusammenführungsschlüssel. Um diese Option zu verwenden, wählen Sie die Spalte aus, die Sie zusammenführen möchten, und dann den Zusammenführungsschlüssel. Klicken Sie auf das Symbol "Validieren" (Symbol "Validieren"), um die ausgewählten Werte zu validieren.
      Hinweis

      • Die letzten Aktualisierungswerte für die inkrementelle Spalte werden im Dataload gespeichert. Wenn Sie einen neuen Dataload mit derselben Tabelle erstellen, funktioniert diese Option wie "Anhängen", "Kürzen" und "Neu erstellen", wenn Sie sie das erste Mal ausführen.
      • Wenn die Zieltabelle nicht abgeschnitten ist, starten Sie den Dataload nicht im Modus "Anhängen", "Kürzen" oder "Neu erstellen", und wechseln Sie dann die Aktion in den Modus "Inkrementelle Zusammenführung". Dadurch werden alle vorhandenen Zeilen in der Zieltabelle aktualisiert. Oracle empfiehlt, den Dataload mit der Aktion "Inkrementelle Zusammenführung" zu starten.
    • Inkrementelles Anhängen - Aktualisiert Daten in der ausgewählten Spalte im Zielschema. Um diese Option zu verwenden, wählen Sie die Spalte, die Sie aktualisieren möchten, und klicken Sie auf das Symbol "Validieren" (Symbol "Validieren"), um die Auswahl zu validieren.

      Bei der ersten Ausführung des Dataloads funktioniert diese Option genauso wie die Optionen "Anhängen", "Kürzen" und "Neu erstellen", d.h. alle Zeilen werden in das Ziel eingefügt. Bei allen nachfolgenden Dataload-Ausführungen wird die inkrementelle Spalte verwendet, um nur neue Zeilen zu filtern und Daten anzuhängen, um zu verhindern, dass dieselben Zeilen mehrmals geladen werden.

      Hinweis

      • Die letzten Aktualisierungswerte für die inkrementelle Spalte werden im Dataload gespeichert. Wenn Sie einen neuen Dataload mit derselben Tabelle erstellen, funktioniert diese Option wie "Anhängen", "Kürzen" und "Neu erstellen", wenn Sie sie das erste Mal ausführen.
      • Wenn die Zieltabelle nicht abgeschnitten ist, starten Sie den Dataload nicht im Modus "Anhängen", "Kürzen" oder "Neu erstellen", und wechseln Sie dann die Aktion in den Modus "Inkrementell anhängen". Oracle empfiehlt, den Dataload mit der Aktion "Inkrementell anhängen" zu starten.
    • Recreate (Neu erstellen) – Wenn die Tabelle bereits im Zielschema vorhanden ist, wird die vorhandene Tabelle gelöscht und neu erstellt.
      Hinweis

      Diese Option ist nicht für Datenentitys verfügbar, die mit OCI GoldenGate geladen werden.
    • Truncate (Abschneiden) – Wenn die Tabelle bereits im Zielschema vorhanden ist, werden alle Daten aus der ausgewählten Tabelle gelöscht. Nichts wird gelöscht.
      Hinweis

      Beim Laden von Delta Share-Daten enthält die Seite "Detail für Dataload" nur die Option Symbol "Ausführen". Sie können keine anderen Aktionen - inkrementelle Zusammenführung, inkrementelles Anhängen, Neuerstellen, Abschneiden, Anhängen - auf die Datenentitys anwenden, bevor Sie sie in das Zielschema laden. Dadurch wird sichergestellt, dass die Daten zwischen dem Delta Sharing-Server und dem Zielschema konsistent sind.
    • Anhängen – Fügt alle Zeilen im Dataset in das Ziel ein. Wenn das Dataset Datensätze enthält, die bereits im Ziel vorhanden sind, sind doppelte Datensätze vorhanden. Verwenden Sie "Anhängen", wenn das Quell-Dataset nur neue Datensätze enthalten soll oder doppelte Zeilen im Ziel kein Problem darstellen.
    • Nicht laden – Überspringt die ausgewählte Datenentity aus dem Dataload-Job. Nachdem Sie auf Speichern geklickt haben, sind diese Datenentitys für zukünftige Dataload-Jobs nicht mehr verfügbar.

    Sie können mehrere Datenentitys auswählen und verschiedene Aktionen anwenden. Die nicht gespeicherten Zeilen sind fett hervorgehoben.

    Hinweis

    Diese Optionen sind für Delta Share-Verbindungen nicht verfügbar.
  3. Um anzugeben, wie die Quellspaltennamen in den Zieltabellen gespeichert werden sollen, klicken Sie auf Einstellungen, das sich auf der rechten Seite der Seite "Detail für Dataload" befindet. Wählen Sie eine der folgenden Optionen:
    • Ursprüngliche Namen beibehalten, indem alle Namen mit Begrenzungszeichen eingeschlossen werden: Erstellt Spaltennamen mit denselben Namen wie aus den Quelltabellen in der Zieltabelle.
    • Keine Begrenzungszeichen verwenden: Dies ist die Standardauswahl. Konvertiert alle Spaltennamen in Großbuchstaben und ersetzt Leerzeichen und Sonderzeichen durch Unterstriche.

      Die folgenden Optionen gelten für reservierte Wörter wie Date, Timestamp, Start usw.

      • Mit Begrenzungszeichen schließen: Dies ist die Standardauswahl. Schließt Spaltennamen, bei denen es sich um reservierte Wörter handelt, mit Begrenzungszeichen ein (nicht alle Spaltennamen).
      • Präfix verwenden: Fügt das angegebene Präfix Spaltennamen hinzu, bei denen es sich um reservierte Wörter handelt (nicht um alle Spaltennamen).

      Bei Spaltennamen, die nach der Konvertierung denselben Namen haben, wird den Namen ein numerischer Wert als Suffix angehängt, um die Eindeutigkeit beizubehalten. Beispiel für Spaltennamen

      Date, date, DATE, Item_@Code, Item$$Code, Item%%Code

      werden in der Zieltabelle erstellt als

      DATE, DATE_0, DATE_1, ITEM__CODE, ITEM__CODE_0, ITEM__CODE_1.

    Hinweis

    Nachdem der Dataload ausgeführt wurde, werden die ausgewählten Optionen angewendet und für alle nachfolgenden Ausführungen beibehalten. Sie können die Konfiguration nicht ändern.
  4. Klicken Sie auf Symbol "Speichern", um die Änderungen zu speichern. Ein grünes Häkchen (grünes Häkchensymbol) in der Zeile gibt an, dass die Änderungen gespeichert werden.
  5. Um den Dataload zu starten,
    • Klicken Sie auf Symbol "Ausführen".
    • Klicken Sie bei Dataloads für GoldenGate auf Symbol "Bereitstellen".

    Wenn der Dataload erfolgreich gestartet wird, wird eine Bestätigungsaufforderung angezeigt.

Informationen zum Prüfen des Status des Dataloads finden Sie im Bereich "Status" rechts unter den Details des Zielschemas. Details zum Bereich "Status" finden Sie unter Status von Dataloads, Datenflüssen und Workflows Überwachen. In diesem Bereich werden Links zu den Jobs angezeigt, die zum Ausführen dieses Dataloads ausgeführt werden. Klicken Sie auf den Link, um den Fortschritt auf der Seite "Jobdetails" zu überwachen. Weitere Informationen zu Jobs finden Sie unter Jobs erstellen und verwalten.

Dataload auf der Seite "Workflowdetails" ausführen

Sie können einem Workflow zusammen mit Datenflüssen oder Workflows mehrere Dataloads hinzufügen und diese als separate Schritte ausführen. Im linken Bereich der Seite "Workflowdetails" werden die Datenflüsse, Workflows und Dataloads aufgeführt, die zur Verwendung verfügbar sind.

Für Dataloads werden im linken Fensterbereich die folgenden beiden Ordner aufgeführt:
  • Dataloads: Dieser Ordner listet alle Dataloads auf, die Sie in der lokalen Datentransformationsinstanz erstellt haben. Wenn Sie einen Schritt im Workflow auswählen, bei dem es sich um einen lokalen Dataload handelt, wird im Bereich "Eigenschaften" auf der rechten Seite der Designleinwand der Typ als Data Load und das verknüpfte Objekt als Home><nameofDataLoad> angezeigt.
  • Remote-Dataloads: Dieser Ordner listet alle Dataloads auf, die Sie in einer Remotedatentransformationsinstanz erstellt haben. Siehe Verbindung für Datentransformationen zum Remote-Laden von Daten erstellen. Wenn Sie einen Schritt im Workflow auswählen, bei dem es sich um einen Remote-Dataload handelt, wird im Bereich "Eigenschaften" auf der rechten Seite der Designleinwand der Typ als Remote Data Load und das verknüpfte Objekt als Name of the Data Transforms connection > <nameofDataLoad> angezeigt.

Nachdem Sie die Dataloads zum Workflow hinzugefügt haben, klicken Sie auf Symbol "Ausführen", um sie auszuführen.