Konfigurowanie przepływu danych na potrzeby przetwarzania przyrostowego

Aby z bazy danych były ładowane tylko rekordy nowe lub zaktualizowane, należy w przepływie danych zastosować przetwarzanie przyrostowe.

Zastosowanie przetwarzania przyrostowego w przepływie danych umożliwia ładowanie tylko nowych danych, zamiast wykonywania za każdym razem pełnego ładowania, które jest nieefektywne i kosztowne. Innymi słowy, podczas każdego ładowania danych przy użyciu przepływu danych będą przetwarzane tylko nowe dane, które zostały dodane po wykonaniu ostatniego przebiegu.
Przed rozpoczęciem należy utworzyć połączenie z jedną z obsługiwanych docelowych baz danych, takich jak Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive czy Map R Hive. Następnie należy skonfigurować wskaźnik nowych danych dla bazy danych. Zob. Określanie wskaźnika nowych danych w źródle danych.
  1. Utworzyć lub otworzyć przepływ danych, w którym ma zostać zastosowane przetwarzanie przyrostowe.
  2. W edytorze przepływu danych wybrać etap Zapisywanie danych - zostanie wyświetlone okienko "Edytor etapu".
  3. W polu Zbiór danych podać nazwę wejściowego zbioru danych określonego na etapie Dodawanie danych.
  4. Wybrać dla opcji Zapisz dane w ustawienie Połączenie z bazą danych.
  5. Kliknąć przycisk Wybór połączenia, po czym wybrać połączenie z jedną z obsługiwanych docelowych baz danych.
  6. W polu Tabela określić nazwę docelowej tabeli, w której jest wykonywany zapis.
  7. Wybrać dla opcji Po uruchomieniu ustawienie Dodaj nowe dane do istniejących danych.
  8. Kliknąć Zapisz.