Inkrementelle Verarbeitung in einem Datenfluss anwenden

Wenden Sie die inkrementelle Verarbeitung in einem Datenfluss an, um nur neue oder aktualisierte Datensätze aus einer Datenbank zu laden.

Erstellen Sie zunächst eine Verbindung zu einer der unterstützten Datenbanken, wie Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive oder Map R Hive.
  1. Erstellen oder öffnen Sie den Datenfluss, auf den Sie die inkrementelle Verarbeitung anwenden möchten.
  2. Wählen Sie im Datenflusseditor den Schritt Daten speichern aus, um den Bereich "Schritteditor" anzuzeigen.
  3. Geben Sie im Feld Dataset den Namen des Eingabe-Datasets an (das Dataset, das im Schritt Daten hinzufügen angegeben wurde).
  4. Wählen Sie in der Option Daten speichern in Datenbankverbindung aus.
  5. Klicken Sie auf Verbindung auswählen, und wählen Sie eine Verbindung zu einer der unterstützten Zieldatenbanken aus.
  6. Geben Sie im Feld Daten den Namen der Zieltabelle an, in die Sie Daten schreiben.
  7. Wählen Sie unterBei Ausführung die Option Neue Daten zu vorhandenen Daten hinzufügen aus.
  8. Klicken Sie auf Speichern.
    Jetzt können Sie den Datenfluss für das regelmäßige Laden neuer Daten planen.