Especificación de un indicador de nuevos datos para un origen de datos

Para configurar el procesamiento incremental en un flujo de datos, seleccione la columna de datos que se utilizará como indicador de nuevos datos del flujo en el origen de datos. Este indicador determina cuándo se detectan nuevos datos desde la última vez que se ejecutó el flujo de datos. Por ejemplo, puede seleccionar una columna de registro de hora.

Antes de empezar, cree una conexión a una de las bases de datos soportadas; por ejemplo, Oracle, Oracle Autonomous Data Warehouse, Apache Hive, Hortonworks Hive o Map R Hive.
  1. En la página de inicio, haga clic en Navegador y, a continuación, en Datos
  2. Pase el cursor por encima de un juego de datos, haga clic en Acciones y, a continuación, seleccione Abrir.
  3. En el Diagrama de unión, haga doble clic en la tabla que incluye el identificador incremental que desea utilizar.
  4. Haga clic en Editar definición.
  5. Si no se muestra el panel de acceso a los datos, vaya al centro del borde derecho de la ventana para buscar la opción Ampliar y, a continuación, haga clic en Ampliar.

    Ahora, puede ver las opciones de almacenamiento en caché y el campo Indicador de nuevos datos de flujo en Avanzado.
    A continuación se muestra la descripción de GUID-B895C974-E71A-43DE-BC01-CB0698F8BDF2-default.png
    .png

  6. En el campo Indicador de nuevos datos de flujo, seleccione una columna para detectar cuándo se agregan nuevos datos.
  7. Haga clic en Aceptar.