Anvend trinvis behandling i et dataflow for kun at indlæse nye eller opdaterede records fra en database.
Hvis du anvender trinvis behandling i et dataflow, kan du nøjes med at indlæse nye data i stedet for at udføre en fuld indlæsning hver gang, hvilket er ineffektivt og dyrt. Med andre ord, hver gang du indlæser data ved hjælp af et dataflow, behandler du kun nye data, der er tilføjet siden sidste kørsel.
Inden du går i gang, skal du oprette en forbindelse til en af de understøttede databaser, for eksempel Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive eller Map R Hive. Konfigurer derefter en ny dataindikator for databasen. Se
Angive en ny dataindikator for en datakilde.
- Opret eller åbn det dataflow, hvor du vil anvende trinvis behandling.
- Vælg trinnet Gem data i trinnet for datafloweditoren for at vise ruden Trineditor.
- Angiv i feltet Datasæt navnet på inputdatasættet, som er angivet i trinnet Tilføj data.
- Ved valget Gem data i skal du vælge Databaseforbindelse.
- Klik på Vælg forbindelse, og vælg en forbindelse til en af de understøttede måldatabaser.
- Angiv navnet på den måltabel, som du skriver til, i feltet Tabel.
- Vælg Føj nye data til eksisterende data i valget Under kørsel.
- Klik på Gem.