Använd inkrementell bearbetning för att ladda endast nya eller uppdaterade poster från en databas.
Genom att använda inkrementell bearbetning i ett dataflöde kan du ladda enbart nya data istället för att utföra en fullständig laddning varje gång, vilket är ineffektivt och kostsamt. Varje gång du laddar data med ett dataflöde behandlar du med andra ord bara nya data som har lagts till sedan den senaste körningen.
Innan du börjar ska du skapa en anslutning till någon av databaserna som stöds, t.ex. Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive eller Map R Hive. Sedan konfigurerar du en ny dataindikator för databasen. Se
Ange en indikator för nya data för en datakälla.
- Skapa eller öppna det dataflöde som du vill använda inkrementell bearbetning för.
- Välj steget Spara data i Redigera dataflöde, så visas rutan Redigera steg.
- I fältet Datamängd anger du namnet på indatamängden som angavs i steget Lägg till data.
- För alternativet Spara data i väljer du Databasanslutning.
- Klicka på Välj anslutning och välj en anslutning till någon av måldatabaserna som stöds.
- I fältet Tabell anger du namnet på måltabellen du skriver till.
- I alternativet Vid körning väljer du Lägg till nya data till befintliga data.
- Klicka på Spara.