Creación de un flujo de datos

Cree un flujo de datos en un proyecto o en una carpeta en Data Integration. Un flujo de datos es un programa visual que representa el flujo de datos desde los activos de datos de origen, como una base de datos o un archivo plano, hasta los activos de datos de destino, como un lago de datos o un almacén de datos.

Data Integration incluye un proyecto por defecto para empezar. Para crear otros proyectos o carpetas, consulte Proyectos y carpetas.

    1. En la sección Flujos de datos del proyecto o la carpeta en la que desea crear un flujo de datos, seleccione Crear flujo de datos. Si necesita ayuda para buscar la sección Flujos de datos en una página de detalles de proyecto o carpeta, consulte Listado de flujos de datos.

      Data Integration muestra el diseñador en un separador. El lienzo está vacío. El panel Operadores y el panel Propiedades están abiertos. Para obtener información sobre los operadores, consulte Uso de operadores de flujo de datos.

    2. En el separador Detalles del panel Propiedades, introduzca un nombre y una descripción opcional para el flujo de datos.

      El identificador es un valor generado por el sistema basado en el nombre. Puede cambiar el valor, pero después de crear y guardar el flujo de datos, no puede actualizar el identificador.

    3. (Opcional) En el campo Proyecto o carpeta, haga clic en Seleccionar y seleccione un proyecto o una carpeta diferentes en los que guardar el flujo de datos.
    4. Arrastre los operadores de flujo de datos desde el panel Operadores al lienzo para diseñar el flujo de datos.

      Para ser válido, un flujo de datos debe tener al menos un operador de origen y un operador de destino. Aunque Data Integration soporta varios operadores de destino en un flujo de datos, un operador de destino solo puede tener un puerto de entrada.

      Consejo

      Al utilizar un operador de ordenación, aplique el operador de ordenación después de aplicar otros operadores. La aplicación del operador de ordenación inmediatamente antes del operador de destino garantiza que los datos del destino se insertan en el orden de clasificación que desee.

    5. Para duplicar un operador de origen, destino o expresión, haga clic con el derecho en el icono de operador y seleccione Duplicar. A continuación, seleccione el operador duplicado y cambie el nombre del identificador en el panel Propiedades.

      Si el operador original está conectado a otros operadores, las conexiones no se copiarán en el operador duplicado.

    6. Conecte los operadores del lienzo:
      • Coloque el puntero sobre un operador hasta que vea el conector (círculo pequeño) en el lado derecho del operador y, a continuación, arrastre el conector al siguiente operador al que desea conectarse. La conexión es válida cuando una línea conecta los operadores después de soltar el conector.

        Nota

        Una línea de conexión simboliza cómo fluyen los datos de un nodo al otro. Aunque puede arrastrar un conector visible de un objeto a otro, no puede tener más de una línea de conexión de entrada a un operador de filtro, expresión, agregación, agregación, distinto, ordenación y destino.

      • Para insertar un operador entre dos operadores conectados, haga clic con el botón derecho en la línea de conexión y utilice el menú Insertar.

      • Para suprimir una conexión, haga clic con el botón derecho en la línea y seleccione Suprimir.

    7. En el separador Detalles del panel Propiedades, configure las propiedades básicas y necesarias para cada operador.
      • Para obtener información sobre la asignación de parámetros y la visualización de parámetros del sistema disponibles en tiempo de ejecución, consulte Uso de parámetros de flujo de datos.

      • Cuando corresponda, utilice el separador Opciones avanzadas para especificar otras propiedades. Para obtener información sobre las propiedades avanzadas de cada operador, consulte Uso de operadores de Data Flow.

    8. Para guardar el flujo de datos por primera vez, seleccione uno de los siguientes botones:
      • Crear: crea y guarda el flujo de datos. Puede seguir creando y editando el flujo de datos en el diseñador.
      • Crear y cerrar: crea y guarda el flujo de datos, cierra el diseñador y le devuelve a la lista Flujos de datos de la página de detalles del proyecto o carpeta.
    9. Guarde periódicamente mientras trabaja en el diseñador seleccionando uno de los siguientes botones:
      • Guardar: confirma los cambios desde la última vez que se guardó. Puede continuar editando después de guardar.
      • Guardar y cerrar: confirma los cambios, cierra el diseñador y le devuelve a la lista Flujos de datos de la página de detalles del proyecto o carpeta.
      • Guardar como: confirma los cambios (desde la última vez que se guardó) y guarda una copia en lugar de sobrescribir el flujo de datos actual. Puede proporcionar un nombre para la copia y seleccionar otro proyecto o carpeta para la copia o guardar la copia en el mismo proyecto o carpeta que el flujo de datos actual.
    10. Valide el flujo para comprobar si hay advertencias o errores que puedan causar problemas durante el tiempo de ejecución. En la barra de herramientas del diseñador, seleccione Validar.

      Data Integration muestra el panel Validación global. Si se encuentran advertencias o errores, seleccione un nombre de identificador en la lista de problemas para centrar el operador con esa advertencia o error en el lienzo.

    11. Cuando termine de trabajar en el flujo de datos, seleccione Crear y cerrar o Guardar y cerrar.
    Para ejecutar el flujo de datos, cree una tarea de integración. Consulte Creación de una tarea de integración.
  • Utilice el comando oci data-integration data-flow create y los parámetros necesarios para crear un flujo de datos:

    oci data-integration data-flow create [OPTIONS]

    Para obtener una lista completa de indicadores y opciones de variables para los comandos de la CLI, consulte la Referencia de la línea de comandos.

  • Ejecute la operación CreateDataFlow para crear un flujo de datos.