Een gegevensstroom configureren voor incrementele verwerking

Pas de incrementele verwerking in een gegevensstroom op zo'n manier toe dat alleen nieuwe of bijgewerkte records uit een database worden geladen.

Door incrementele verwerking toe te passen op een gegevensstroom kunt u alleen nieuwe gegevens laden, in plaats van dat u iedere keer alle gegevens laadt, wat inefficiënt en kostbaar is. Met andere woorden, telkens wanneer u gegevens laadt met behulp van een gegevensstroom, verwerkt u alleen nieuwe gegevens die sinds de laatste uitvoering zijn toegevoegd.
Maak voordat u begint verbinding met een van de ondersteunde databases, bijvoorbeeld Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive of Map R Hive. Configureer daarna een nieuwe gegevensindicator voor die database. Zie voor meer informatie: Indicator nieuwe gegevens opgeven voor een gegevensbron.
  1. Maak of open de gegevensstroom waarop u incrementele verwerking wilt toepassen.
  2. Selecteer in de gegevensstroomeditor de stap Gegevens opslaan om het deelvenster Stapeditor weer te geven.
  3. Geef in het veld Gegevensset de naam op van de invoergegevensset die in de stap Gegevens toevoegen is opgegeven.
  4. Selecteer Databaseverbinding bij de optie Gegevens opslaan in.
  5. Klik op Verbinding selecteren en selecteer een verbinding met een van de ondersteunde doeldatabases.
  6. Geef in het veld Tabel de naam op van de doeltabel waaraan u gegevens wilt toevoegen.
  7. Selecteer Nieuwe gegevens toevoegen aan bestaande gegevens bij de optie Bij uitvoering.
  8. Klik op Opslaan.