Configurare un flusso dati per l'elaborazione incrementale

Applicare l'elaborazione incrementale in un flusso dati per caricare solo record nuovi o aggiornati da un database.

Applicare l'elaborazione incrementale in un flusso dati per caricare solo i nuovi dati anziché eseguire ogni volta un caricamento completo, operazione inefficiente e costosa. In altre parole, ogni volta che si caricano dati utilizzando un flusso dati, si elaborano solo i nuovi dati aggiunti dall'ultima esecuzione.
Prima di iniziare, creare una connessione a uno dei database supportati, ad esempio Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive o Map R Hive. Quindi, configurare un nuovo indicatore di dati per il database specifico. Vedere Specificare un indicatore nuovi dati per un'origine dati.
  1. Creare o aprire il flusso dati a cui si desidera applicare l'elaborazione incrementale.
  2. Nell'editor Flusso dati selezionare il passo Salva dati per visualizzare il riquadro Editor passi.
  3. Nel campo Data set specificare il nome del data set di input specificato nel passo Aggiungi dati.
  4. Per l'opzione Salva dati in selezionare Connessione al database.
  5. Fare clic su Seleziona connessione e selezionare una connessione a uno dei database di destinazione supportati.
  6. Nel campo Tabella specificare il nome della tabella di destinazione in cui si eseguono le operazioni di scrittura.
  7. Per l'opzione Durante l'esecuzione selezionare Aggiungere nuovi dati ai dati esistenti.
  8. Fare clic su Salva.