Konfigurácia dátového toku pre prírastkové spracovanie

V dátovom toku môžete použiť prírastkové spracovanie, aby sa zavádzali iba nové alebo aktualizované záznamy z databázy.

Použitie prírastkového spracovania v dátovom toku umožňuje zaviesť iba nové dáta namiesto toho, aby sa zakaždým vykonalo úplné zavedenie, ktoré je neefektívne a nákladné. Inými slovami, zakaždým, keď dáta zavediete pomocou dátového toku, spracujete iba nové dáta, ktoré boli pridané od posledného spustenia.
Skôr než začnete, vytvorte pripojenie k jednej z podporovaných databáz, ako je napríklad databáza Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive alebo Map R Hive. Potom pre databázu nakonfigurujte indikátor nových dát. Pozrite si časť Zadanie indikátora nových dát pre dátový zdroj.
  1. Vytvorte alebo otvorte dátový tok, v ktorom chcete použiť prírastkové spracovanie.
  2. V editore Dátový tok vyberte krok Uložiť dáta na zobrazenie podokna Editor kroku.
  3. Do poľa Množina dát zadajte názov vstupnej množiny dát, ktorá bola zadaná v kroku Pridať dáta.
  4. Pre voľbu Uložiť dáta do vyberte položku Databázové pripojenie.
  5. Kliknite na položku Vybrať pripojenie a vyberte pripojenie k jednej z podporovaných cieľových databáz.
  6. Do poľa Tabuľka zadajte názov cieľovej tabuľky, do ktorej zapisujete.
  7. V sekcii Pri spustení vyberte položku Pridať nové dáta k existujúcim dátam.
  8. Kliknite na tlačidlo Uložiť.