Konfigurace toku dat pro přírůstkové zpracování

Použijte přírůstkové zpracování v datovém toku k načtení pouze nových nebo aktualizovaných záznamů z databáze.

Použití přírůstkového zpracování v datovém toku umožňuje načítat pouze nová data, bez nutnosti pokaždé provádět úplné načtení, které je neefektivní a nákladné. Jinými slovy, při každém načtení dat pomocí toku dat se zpracovávají pouze nová data, která byla od posledního spuštění přidána.
Než začnete, vytvořte připojení k jedné z podporovaných databází, například Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive nebo Map R Hive. Poté konfigurujte nový indikátor dat pro tuto databázi. Viz část Určení nového indikátoru dat pro zdroj dat.
  1. Vytvořte nebo otevřete datový tok, ve kterém chcete použít přírůstkové zpracování.
  2. V editoru datových toků vyberte krok Uložit data a zobrazte podokno editoru kroků.
  3. V poli Datová sada zadejte název vstupní datové sady uvedené v kroku Přidat data.
  4. Pro položku Uložit data do vyberte volbu Připojení k databázi.
  5. Klikněte na položku Vybrat připojení a vyberte připojení k jedné z podporovaných cílových databází.
  6. Do pole Tabulka zadejte název cílové tabulky, do které zapisujete.
  7. Ve volbě Při spuštění vyberte Přidat nová data ke stávajícím datům.
  8. Klikněte na tlačítko Uložit.