Trabajar con Tareas del Cargador de Datos

Una tarea del cargador de datos permite tomar datos de un origen y cargarlos en un destino. Las tareas del cargador de datos son esenciales para la preparación de datos, la migración de datos o la carga de diversos datos en lagos de datos o almacenes de datos.

En Data Integration, puede utilizar una tarea del cargador de datos para realizar una carga de 1 a 1 o de n a n de datos de un tipo de sistema a otro, con la opción de varias o ninguna transformación de datos antes de la carga. Al crear una tarea del cargador de datos, Data Integration le guía por el proceso de selección de la entidad o entidades de origen y destino, aplicación de transformaciones y validación de la tarea. Para el destino, tiene la opción de crear la entidad o entidades antes de cargar o seleccionar entidades existentes en las que cargar los datos. Tanto para el origen como para el destino, tiene la opción de utilizar parámetros para especificar los recursos y reutilizar parámetros como se describe en Parámetros para origen y destino.

En las siguientes páginas se describe cómo crear, editar y suprimir tareas del cargador de datos:

En las siguientes páginas se describe cómo utilizar parámetros en una tarea del cargador de datos:

En las siguientes páginas se describen otras tareas de gestión que se pueden realizar:

Partes de una tarea del cargador de datos

La configuración de una tarea para cargar datos de un origen a un destino implica varios pasos.

  • Información básica y Tipo de carga: seleccione el tipo de la entidad de datos de origen y la entidad de datos de destino y el tipo de carga.

    Para los tipos de activos de datos de base de datos, almacenamiento de archivos y aplicaciones SaaS que puede utilizar como entidades de datos de origen y destino, consulte Tipos de origen y destino soportados.

    Para el tipo de carga, los datos de origen que se van a cargar pueden proceder de Varias entidades de datos en un esquema o de Una sola entidad de datos. Por ejemplo, los datos de dos o más entidades de un origen de Oracle Database se pueden cargar en un destino de Object Storage.

  • Origen: seleccione el activo de datos, la conexión y el esquema que tiene los datos de origen para cargar. A continuación, en función del tipo de carga especificado, seleccione una o más entidades de datos para agregar al origen para la carga. Consulte Selección del origen.

    Para parametrizar un recurso en el origen, consulte Parámetros para origen y destino.

  • Destino: seleccione el activo de datos, la conexión, el esquema y la entidad de datos que desea utilizar como destino. Por defecto, las entidades de origen y destino se asignan por nombre. Si no tiene una entidad existente que cargar, puede crear una nueva entidad de datos. Consulte Selección del destino.

    Para parametrizar un recurso de destino, consulte Uso de parámetros para origen y destino.

  • Transformación: utilice los separadores interactivos para aplicar transformaciones en los atributos de origen. Una tarea del cargador de datos soporta transformaciones en los niveles de metadatos y datos. Consulte Aplicación de transformaciones.
  • Asignación de atributos: al cargar datos en una entidad de datos de destino existente o en varias entidades, por defecto, los atributos de origen se asignan a los atributos de destino por nombre de atributo. Puede aplicar más reglas de asignación a todos los atributos de todas las entidades asignadas. Consulte Asignación de atributos.
  • Revisar y validar: revise y cambie cualquiera de los pasos de configuración y asegúrese de que la tarea del cargador de datos sea válida antes de publicar. Consulte Revisión y validación de la tarea.

Parámetros para origen y destino

Mediante el uso de parámetros para el origen o el destino, tiene la flexibilidad de utilizar la misma tarea del cargador de datos para diferentes orígenes de datos o destinos de datos en tiempo de diseño o tiempo de ejecución.

Puede utilizar un parámetro para cada uno de los siguientes recursos, tanto en el tipo de carga de entidad de datos único como en el tipo de carga de varias entidades de datos:

  • Activo de datos de origen, conexión y esquema o cubo
  • Activo de datos de destino, conexión y esquema o cubo

Tenga en cuenta que cuando el tipo de activo de datos es Object Storage, puede parametrizar el cubo (esquema), pero no el compartimento que contiene el cubo.

Con el recurso de entidad de datos, puede parametrizar la entidad de origen o la entidad de destino solo en las siguientes condiciones:

  • Al utilizar el tipo de carga de entidad de datos única
  • Al crear una nueva entidad de datos en el destino introduciendo un nombre de entidad
  • Al utilizar una entidad de datos existente en el destino

Al parametrizar un recurso en el origen y el destino, Data Integration agrega y utiliza automáticamente los siguientes nombres de parámetros:

Recurso Nombre de parámetro de origen de origen Nombre de parámetro de destino
Activo de datos SOURCE_DATA_ASSET TARGET_DATA_ASSET
Conexión SOURCE_CONNECTION TARGET_CONNECTION
Esquema o cubo SOURCE_SCHEMA TARGET_SCHEMA
Entidad de datos SOURCE_DATA_ENTITY TARGET_DATA_ENTITY

Para parametrizar un recurso en el destino, consulte también Reutilización de parámetros para recursos de origen o destino.

Adición, Edición y Eliminación de Parámetros

Los parámetros se gestionan en el paso Origen y el paso Destino al crear la tarea del cargador de datos.

Después de seleccionar un activo de datos, una conexión, un esquema o una entidad de datos de origen, puede asignar un parámetro a un recurso seleccionando Parámetroizar que esté junto al recurso.

Del mismo modo, para los recursos de destino, después de seleccionar un activo de datos, una conexión, un esquema o una entidad de datos de destino, puede asignar un parámetro a un recurso seleccionando Parámetroizar que esté junto al recurso.

Para parametrizar un recurso en el origen o el destino, consulte también Reutilización de parámetros para recursos de origen o destino.

Una vez agregados los parámetros, puede editar un nombre de parámetro y agregar una descripción. Consulte Edición de un parámetro de recurso.

Para eliminar un parámetro asignado a un recurso, consulte Eliminación de un parámetro de recurso.

Reutilización de parámetros para recursos de origen o de destino

Supongamos que ha parametrizado el activo de datos de origen, la conexión, el esquema o la entidad de datos en una tarea del cargador de datos. Para parametrizar los recursos de destino, en lugar de seleccionar Parámetroizar, puede seleccionar Reutilizar parámetro <tipo de recurso> de origen para utilizar los mismos parámetros que los que se han agregado a los recursos del mismo tipo en el origen.

Del mismo modo, si ha parametrizado los recursos de destino y desea utilizar los parámetros de destino para los recursos del mismo tipo en el origen, puede seleccionar Reutilizar parámetro <tipo de recurso> de destino para parametrizar el activo de datos de origen, la conexión, el esquema o la entidad de datos.

Al parametrizar un recurso de origen o de destino reutilizando el parámetro de recurso del mismo tipo que está en el destino o el origen, Data Integration no crea un nuevo parámetro. En su lugar, solo se utiliza un parámetro para un tipo de recurso que está en el origen y el destino.

Por ejemplo, si un activo de datos de origen de Object Storage tiene parámetros, el nombre del parámetro del activo de datos de destino de Object Storage es SOURCE_DATA_ASSET al volver a utilizar el parámetro de origen para el activo de datos de destino, como se muestra en la siguiente tabla:

Recurso de destino Nombre de parámetro de destino al reutilizar el parámetro de origen del mismo tipo
Activo de datos SOURCE_DATA_ASSET
Conexión SOURCE_CONNECTION
Esquema o cubo SOURCE_SCHEMA
Entidad de datos SOURCE_DATA_ENTITY

Del mismo modo, si un recurso de destino de Object Storage, como la conexión, tiene parámetros, el parámetro de conexión de origen de Object Storage es TARGET_CONNECTION al volver a utilizar el parámetro de destino para la conexión de origen.

Recurso en origen Nombre de parámetro de origen al reutilizar el parámetro de destino del mismo tipo
Activo de datos TARGET_DATA_ASSET
Conexión TARGET_CONNECTION
Esquema o cubo TARGET_SCHEMA
Entidad de datos TARGET_DATA_ENTITY