Configurar um Fluxo de Dados para Processamento Incremental

Aplique o processamento incremental em um fluxo de dados para carregar apenas registros novos ou atualizados de um banco de dados.

A aplicação de processamento incremental em um fluxo de dados permite carregar apenas dados novos em vez de executar uma carga total todas as vezes, o que é ineficiente e caro. Em outras palavras, cada vez que carrega dados usando um fluxo de dados, você só processa novos dados que foram adicionados desde a última execução.
Antes de começar, crie uma conexão com um dos bancos de dados suportados, por exemplo Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive ou Map R Hive. Em seguida, configure um indicador de novos dados para esse banco de dados. Consulte Especificar um Novo Indicador de Dados para uma Origem de Dados.
  1. Crie ou abra o fluxo de dados no qual deseja aplicar o processamento incremental.
  2. No editor de Fluxo de Dados, selecione a etapa Salvar Dados para exibir o painel Editor de etapa.
  3. No campo Conjunto de Dados, especifique o nome do conjunto de dados de entrada especificado na etapa Adicionar Dados.
  4. Na opção Salvar dados em, selecione Conexão de Banco de Dados.
  5. Clique em Selecionar Conexão selecione uma conexão para um dos bancos de dados de destino suportados.
  6. No campo Tabela, especifique o nome da tabela de destino na qual você está gravando.
  7. Na opção Ao executar, selecione Adicionar novos dados aos dados existentes.
  8. Clique em Salvar.