Można skonfigurować przetwarzanie przyrostowe, tak aby z bazy danych były ładowane tylko rekordy nowe lub zaktualizowane. Przetwarzanie przyrostowe można wdrożyć, jeśli dane opierają się na bazie danych (przy użyciu połączenia z bazą danych).
Przetwarzanie przyrostowe zapewnia aktualność danych, co przekłada się na lepsze spostrzeżenia dot. jakości.
Przed rozpoczęciem należy utworzyć połączenie z jedną z obsługiwanych docelowych baz danych, takich jak Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive czy Map R Hive.
- Określić wskaźnik nowych danych w źródle danych. Zob. Określanie wskaźnika nowych danych w źródle danych.
- Skonfigurować przepływ danych na potrzeby przetwarzania przyrostowego. Zob. Konfigurowanie przepływu danych na potrzeby przetwarzania przyrostowego.
Teraz można zaplanować przepływ danych w celu regularnego ładowania nowych danych.