Indikator für neue Daten für eine Datenquelle angeben

Wählen Sie die Datenspalte aus, die als Indikator für neue Daten in der Datenquelle verwendet werden soll. Dieser Indikator bestimmt, wann neue Daten seit der letzten Ausführung des Datenflusses erkannt werden. Beispiel: Sie können eine Zeitstempelspalte auswählen.

Durch Angabe eines Indikators für neue Daten können Sie eine inkrementelle Verarbeitung beim Laden von Daten vornehmen. Anders gesagt: Jedes Mal, wenn Sie Daten mit einem Datenfluss laden, verarbeiten Sie nur neue Daten, die seit der letzten Ausführung hinzugefügt wurden.
Erstellen Sie zunächst eine Verbindung zu einer der unterstützten Datenbanken, wie Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive oder Map R Hive.
  1. Klicken Sie auf der Homepage auf Navigator Navigatorsymbol zum Anzeigen des Navigators und dann auf Daten.
  2. Zeigen Sie mit der Maus auf das Dataset, klicken Sie auf Aktionen, und wählen Sie Öffnen aus.
  3. Doppelklicken Sie im Join-Diagramm auf die Tabelle mit der gewünschten inkrementellen ID.
  4. Klicken Sie auf Definition bearbeiten.
  5. Wenn der Datenzugriffsbereich nicht angezeigt wird, gehen Sie in der Mitte der rechten Kante des Fensters zur Option Einblenden, und klicken Sie auf Einblenden.

    Jetzt können Sie die Caching-Optionen und das Feld Indikator für neue Flussdaten unter Erweitert anzeigen.
    Beschreibung von GUID-B895C974-E71A-43DE-BC01-CB0698F8BDF2-default.png folgt
    .png

  6. Wählen Sie in der Liste Indikator für neue Flussdaten eine Spalte aus, um zu erkennen, wenn neue Daten hinzugefügt werden.
  7. Klicken Sie auf OK.