Wenden Sie die inkrementelle Verarbeitung in einem Datenfluss an, um nur neue oder aktualisierte Datensätze aus einer Datenbank zu laden.
Die inkrementelle Verarbeitung in einem Datenfluss ermöglicht es Ihnen, nur neue Daten zu laden, anstatt jedes Mal einen vollständigen Ladevorgang auszuführen, was ineffizient und kostspielig ist. Anders gesagt: Jedes Mal, wenn Sie Daten mit einem Datenfluss laden, verarbeiten Sie nur neue Daten, die seit der letzten Ausführung hinzugefügt wurden.
Erstellen Sie zunächst eine Verbindung zu einer der unterstützten Datenbanken, wie Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive oder Map R Hive. Konfigurieren Sie dann einen Indikator für neue Daten für diese Datenbank. Siehe
Indikator für neue Daten für eine Datenquelle angeben.
- Erstellen oder öffnen Sie den Datenfluss, auf den Sie die inkrementelle Verarbeitung anwenden möchten.
- Wählen Sie im Datenflusseditor den Schritt Daten speichern aus, um den Bereich "Schritteditor" anzuzeigen.
- Geben Sie im Feld Dataset den Namen des Eingabe-Datasets an, das im Schritt Daten hinzufügen angegeben wurde.
- Wählen Sie in der Option Daten speichern in Datenbankverbindung aus.
- Klicken Sie auf Verbindung auswählen, und wählen Sie eine Verbindung zu einer der unterstützten Zieldatenbanken aus.
- Geben Sie im Feld Tabelle den Namen der Zieltabelle an, in die Sie Daten schreiben.
- Wählen Sie unterBei Ausführung die Option Neue Daten zu vorhandenen Daten hinzufügen aus.
- Klicken Sie auf Speichern.