Konfigurere en dataflyt for trinnvis behandling

Bruk trinnvis behandling i en dataflyt for å laste inn bare nye eller oppdaterte poster fra en database.

Når du bruker trinnvis behandling i en dataflyt, kan du laste bare nye data i stedet for å utføre en fullstendig lasting hver gang, noe som er både ineffektivt og dyrt. Hver gang du laster data ved hjelp av en dataflyt, behandler du med andre ord bare nye data som er lagt til siden forrige kjøring.
Før du begynner, oppretter du en tilkobling til én av de støttede databasene, for eksempel Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive eller Map R Hive. Konfigurer deretter en indikator for nye data for databasen. Se Angi en indikator for nye data for en datakilde.
  1. Opprett eller åpne dataflyten der du vil bruke trinnvis behandling.
  2. I redigeringsprogrammet for dataflyter velger du trinnet Lagre data, slik at du kan vise ruten i redigeringsprogrammet for trinn.
  3. I feltet Datasett angir du navnet på inndatasettet som er angitt i trinnet Legg til data.
  4. Ved valget Lagre data i velger du Databasetilkobling.
  5. Klikk på Velg tilkobling og velg en tilkobling til én av de støttede måldatabasene.
  6. I feltet Tabell angir du navnet på måltabellen du skriver til.
  7. Velg Legg til nye data i eksisterende data under Ved kjøring.
  8. Klikk på Lagre.