Настройка потока данных для инкрементной обработки

Применяйте инкрементную обработку в потоке данных для загрузки лишь новых или обновленных записей из базы данных.

Применяя инкрементную обработку в потоке данных, можно загружать лишь новые данные, а не перезагружать их каждый раз полностью, тратя лишнее время и ресурсы. Иначе говоря, каждый раз при загрузке данных с помощью потока данных будут обрабатываться только новые данные, добавленные после прошлого запуска.
Перед началом работы создайте подключение к одной из поддерживаемых баз данных, например Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive или Map R Hive. Затем настройте новый индикатор данных для этой базы данных. См. раздел "Указание нового индикатора данных для источника данных".
  1. Создайте или откройте поток данных, в котором требуется применить инкрементную обработку.
  2. В редакторе потоков данных выберите шаг Сохранить данные, чтобы отобразить панель редактора шагов.
  3. В поле Набор данных укажите имя набора входных данных, указанного в ходе выполнения шага Добавить данные.
  4. В меню Сохранить данные в выберите Подключение к базе данных.
  5. Нажмите Выбрать подключение и выберите подключение к одной из поддерживаемых целевых баз данных.
  6. В поле Таблица укажите имя целевой таблицы, в которую выполняется запись.
  7. В меню Когда выполняется выберите Добавить новые данные к существующим.
  8. Нажмите Сохранить.