Vælg den datakolonne, der skal bruges som indikatoren for nye data i datakilden. Denne indikator bestemmer, hvornår nye data registreres, efter at dataflowet sidste gang blev udført. Du kan for eksempel vælge en tidsstempelkolonne.
Angivelse af en indikator for nye data gør det muligt for dig at foretage trinvis behandling, når du indlæser data. Med andre ord, hver gang du indlæser data ved hjælp af et dataflow, behandler du kun nye data, der er tilføjet siden sidste kørsel.
Inden du går i gang, skal du oprette en forbindelse til en af de understøttede databaser, for eksempel Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive eller Map R Hive.
- Klik på Navigator på startsiden, og klik derefter på Data
- Hold musemarkøren over et datasæt, klik på Handlinger, og vælg derefter Åbn.
- I sammenkædningsdiagrammet skal du dobbeltklikke på tabellen med det trinvise ID, som du vil bruge.
- Klik på Rediger definition.
- Hvis dataadgangspanelet ikke vises, skal du gå til midten af vinduets højre kant og finde valget Udvid og derefter klikke på Udvid.
Du kan nu se caching-valgene og feltet Indikator for nye data i flow under Avanceret.

.png
- Vælg en kolonne til registrering af tilføjelse af nye data i feltet Indikator for nye data i flow.
- Klik på OK.