Indikator für neue Daten für eine Datenquelle angeben

Um die inkrementelle Verarbeitung in einem Datenfluss zu konfigurieren, wählen Sie die Datenspalte aus, die als Indikator für neue Flussdaten in der Datenquelle verwendet werden soll. Dieser Indikator bestimmt, wann neue Daten seit der letzten Ausführung des Datenflusses erkannt werden. Beispiel: Sie können eine Zeitstempelspalte auswählen.

Erstellen Sie zunächst eine Verbindung zu einer der unterstützten Datenbanken, wie Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive oder Map R Hive.
  1. Klicken Sie auf der Homepage auf Navigator und dann auf Daten
  2. Zeigen Sie mit der Maus auf das Dataset, klicken Sie auf Aktionen, und wählen Sie Öffnen aus.
  3. Doppelklicken Sie im Join-Diagramm auf die Tabelle mit der gewünschten inkrementellen ID.
  4. Klicken Sie auf Definition bearbeiten.
  5. Wenn der Datenzugriffsbereich nicht angezeigt wird, gehen Sie in der Mitte der rechten Kante des Fensters zur Option Einblenden, und klicken Sie auf Einblenden.

    Jetzt können Sie die Caching-Optionen und das Feld Indikator für neue Flussdaten unter Erweitert anzeigen.
    Beschreibung von GUID-B895C974-E71A-43DE-BC01-CB0698F8BDF2-default.png folgt
    .png

  6. Wählen Sie in der Liste Indikator für neue Flussdaten eine Spalte aus, um zu erkennen, wenn neue Daten hinzugefügt werden.
  7. Klicken Sie auf OK.