V dátovom toku môžete použiť prírastkové spracovanie, aby sa zavádzali iba nové alebo aktualizované záznamy z databázy.
Použitie prírastkového spracovania v dátovom toku umožňuje zaviesť iba nové dáta namiesto toho, aby sa zakaždým vykonalo úplné zavedenie, ktoré je neefektívne a nákladné. Inými slovami, zakaždým, keď dáta zavediete pomocou dátového toku, spracujete iba nové dáta, ktoré boli pridané od posledného spustenia.
Skôr než začnete, vytvorte pripojenie k jednej z podporovaných databáz, ako je napríklad databáza Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive alebo Map R Hive. Potom pre databázu nakonfigurujte indikátor nových dát. Pozrite si časť
Zadanie indikátora nových dát pre dátový zdroj.
- Vytvorte alebo otvorte dátový tok, v ktorom chcete použiť prírastkové spracovanie.
- V editore Dátový tok vyberte krok Uložiť dáta na zobrazenie podokna Editor kroku.
- Do poľa Množina dát zadajte názov vstupnej množiny dát, ktorá bola zadaná v kroku Pridať dáta.
- Pre voľbu Uložiť dáta do vyberte položku Databázové pripojenie.
- Kliknite na položku Vybrať pripojenie a vyberte pripojenie k jednej z podporovaných cieľových databáz.
- Do poľa Tabuľka zadajte názov cieľovej tabuľky, do ktorej zapisujete.
- V sekcii Pri spustení vyberte položku Pridať nové dáta k existujúcim dátam.
- Kliknite na tlačidlo Uložiť.