Aplique o processamento incremental em um fluxo de dados para carregar apenas registros novos ou atualizados de um banco de dados.
A aplicação de processamento incremental em um fluxo de dados permite carregar apenas dados novos em vez de executar uma carga total todas as vezes, o que é ineficiente e caro. Em outras palavras, cada vez que carrega dados usando um fluxo de dados, você só processa novos dados que foram adicionados desde a última execução.
Antes de começar, crie uma conexão com um dos bancos de dados suportados, por exemplo Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive ou Map R Hive. Em seguida, configure um indicador de novos dados para esse banco de dados. Consulte
Especificar um Novo Indicador de Dados para uma Origem de Dados.
- Crie ou abra o fluxo de dados no qual deseja aplicar o processamento incremental.
- No editor de Fluxo de Dados, selecione a etapa Salvar Dados para exibir o painel Editor de etapa.
- No campo Conjunto de Dados, especifique o nome do conjunto de dados de entrada especificado na etapa Adicionar Dados.
- Na opção Salvar dados em, selecione Conexão de Banco de Dados.
- Clique em Selecionar Conexão selecione uma conexão para um dos bancos de dados de destino suportados.
- No campo Tabela, especifique o nome da tabela de destino na qual você está gravando.
- Na opção Ao executar, selecione Adicionar novos dados aos dados existentes.
- Clique em Salvar.