Paquete DBMS_CLOUD_PIPELINE

El paquete DBMS_CLOUD_PIPELINE permite crear pipelines de datos para cargar y exportar datos en la nube. Este paquete soporta la carga incremental continua de datos de archivos en el almacén de objetos en la base de datos. DBMS_CLOUD_PIPELINE también soporta la exportación incremental continua de datos de tabla o resultados de consulta de la base de datos al almacén de objetos en función de una columna de registro de hora.

Resumen de subprogramas DBMS_CLOUD_PIPELINE
En esta tabla, se resumen los subprogramas incluidos en el paquete DBMS_CLOUD_PIPELINE.
DBMS_CLOUD_PIPELINE Atributos
Los atributos ayudan a controlar y configurar el comportamiento de un pipeline de datos.
DBMS_CLOUD_PIPELINE Vistas
El paquete DBMS_CLOUD_PIPELINE utiliza las siguientes vistas.

Tema principal: Referencia de paquete proporcionado de base de datos de IA autónoma

Resumen de Subprogramas DBMS_CLOUD_PIPELINE

En esta tabla se resumen los subprogramas incluidos en el paquete DBMS_CLOUD_PIPELINE.

Subprograma	Descripción
CREATE_PIPELINE Procedimiento	Crea un nuevo pipeline de datos.
DROP_PIPELINE Procedimiento	Borra un pipeline de datos existente.
RESET_PIPELINE Procedimiento	Restablece el estado de seguimiento de un pipeline de datos. Utilice el pipeline de restablecimiento para reiniciar el pipeline desde el estado inicial de carga o exportación de datos. Si lo desea, el pipeline de restablecimiento puede depurar datos en la base de datos o en el almacén de objetos, según el tipo de pipeline.
RUN_PIPELINE_ONCE Procedimiento	Realiza una ejecución bajo demanda del pipeline en la sesión en primer plano actual, en lugar de un trabajo programado.
SET_ATTRIBUTE Procedimiento	Define atributos de pipeline. Hay dos procedimientos sobrecargados, uno para definir un único atributo y otro para definir varios atributos mediante un documento JSON de pares de nombre/valor de atributo
START_PIPELINE Procedimiento	Inicia el pipeline de datos. Cuando se inicia un pipeline, la operación de pipeline se ejecutará continuamente en un trabajo programado según el "intervalo" configurado en los atributos de pipeline.
STOP_PIPELINE Procedimiento	Para el pipeline de datos. Cuando se para un pipeline, no se programan trabajos futuros para el pipeline.

CREATE_PIPELINE Procedimiento
El procedimiento crea un nuevo pipeline de datos.
DROP_PIPELINE Procedimiento
El procedimiento borra un pipeline de datos existente. Si se ha iniciado un pipeline, se debe parar antes de que se pueda borrar.
RESET_PIPELINE Procedimiento
Restablece el estado de seguimiento de un pipeline de datos. Utilice el pipeline de restablecimiento para reiniciar el pipeline desde el estado inicial de carga o exportación de datos. Si lo desea, el pipeline de restablecimiento puede depurar datos en la base de datos o en el almacén de objetos, según el tipo de pipeline. Un pipeline de datos debe estar en estado parado para restablecerlo.
RUN_PIPELINE_ONCE Procedimiento
Este procedimiento realiza una ejecución bajo demanda del pipeline en la sesión de primer plano actual, en lugar de una ejecución en un trabajo programado. Utilice DBMS_CLOUD_PIPELINE.RUN_PIPELINE_ONCE para probar un pipeline antes de iniciar el pipeline como un trabajo continuo.
SET_ATTRIBUTE Procedimiento
Este procedimiento define atributos de pipeline. Hay dos procedimientos sobrecargados, uno para definir un único atributo y otro para definir varios atributos mediante un documento JSON de pares de nombre/valor de atributo.
START_PIPELINE Procedimiento
El procedimiento inicia el pipeline de datos. Cuando se inicia un pipeline, la operación de pipeline se ejecuta continuamente en un trabajo programado según interval configurado con los atributos de pipeline.
STOP_PIPELINE Procedimiento
El procedimiento para el pipeline de datos. Cuando se para un pipeline, no se programan trabajos futuros para el pipeline.

Tema principal: Paquete DBMS_CLOUD_PIPELINE

CREATE_PIPELINE Procedimiento

El procedimiento crea un nuevo pipeline de datos.

Sintaxis

DBMS_CLOUD_PIPELINE.CREATE_PIPELINE(
      pipeline_name        IN   VARCHAR2,
      pipeline_type        IN   VARCHAR2,
      attributes           IN   CLOB        DEFAULT NULL,
      description          IN   VARCHAR2    DEFAULT NULL
);

Parámetros

Parámetro	Descripción
`pipeline_name`	Especifica un nombre para el pipeline. El nombre del pipeline debe seguir las reglas de nomenclatura de los identificadores SQL de Oracle. Consulte Identificadores para obtener más información. Este parámetro es obligatorio.
`pipeline_type`	Especifica el tipo de pipeline. Valores válidos: `LOAD`, `EXPORT` Este parámetro es obligatorio.
`attributes`	Atributos de pipeline en formato JSON. Valor por defecto: `NULL` Consulte DBMS_CLOUD_PIPELINE Attributes para obtener más información.
`description`	Descripción del pipeline. Valor por defecto: `NULL`

Tema principal: Resumen de subprogramas DBMS_CLOUD_PIPELINE

DROP_PIPELINE Procedimiento

El procedimiento borra un pipeline de datos existente. Si se ha iniciado un pipeline, se debe parar antes de que se pueda borrar.

Sintaxis

DBMS_CLOUD_PIPELINE.DROP_PIPELINE(
       pipeline_name        IN   VARCHAR2,
       force                IN   BOOLEAN DEFAULT FALSE
 );

Parámetros

Parámetro Descripción

Parámetro	Descripción
`pipeline_name`	Especifica un nombre de pipeline. Este parámetro es obligatorio.
`force`	Borrar forzosamente un pipeline, incluso si está en estado iniciado. Valores válidos: `TRUE`, `FALSE` Valor por defecto: `FALSE`

pipeline_name

Especifica un nombre de pipeline.

Este parámetro es obligatorio.

force

Borrar forzosamente un pipeline, incluso si está en estado iniciado.

Valores válidos: TRUE, FALSE

Valor por defecto: FALSE

Nota de uso

Para borrar un pipeline que está en estado iniciado, defina el parámetro force en TRUE.

Tema principal: Resumen de subprogramas DBMS_CLOUD_PIPELINE

RESET_PIPELINE Procedimiento

Restablece el estado de seguimiento de un pipeline de datos. Utilice el pipeline de restablecimiento para reiniciar el pipeline desde el estado inicial de carga o exportación de datos. Si lo desea, el pipeline de restablecimiento puede depurar datos en la base de datos o en el almacén de objetos, según el tipo de pipeline. Un pipeline de datos debe estar en estado parado para restablecerlo.

Sintaxis

DBMS_CLOUD_PIPELINE.RESET_PIPELINE(
       pipeline_name        IN   VARCHAR2,
       purge_data           IN   BOOLEAN DEFAULT FALSE
 );

Parámetros

Parámetro Descripción

Parámetro	Descripción
`pipeline_name`	Especifica un nombre para el pipeline. Este parámetro es obligatorio.
`purge_data`	La depuración de datos se aplica a un pipeline de carga o a un pipeline de exportación: Para un pipeline de carga, al utilizar `TRUE`, trunque los datos en la tabla de base de datos. Para un pipeline de exportación, cuando sea `TRUE`, suprima los archivos de la ubicación del almacén de objetos. Valores válidos: `TRUE`, `FALSE` Valor por defecto: `FALSE`

pipeline_name

Especifica un nombre para el pipeline.

Este parámetro es obligatorio.

purge_data

La depuración de datos se aplica a un pipeline de carga o a un pipeline de exportación:

Para un pipeline de carga, al utilizar TRUE, trunque los datos en la tabla de base de datos.
Para un pipeline de exportación, cuando sea TRUE, suprima los archivos de la ubicación del almacén de objetos.

Valores válidos: TRUE, FALSE

Valor por defecto: FALSE

Notas de uso

Un pipeline de datos debe estar en estado parado para restablecerlo. Consulte STOP_PIPELINE Procedure para obtener más información.
Para un pipeline de carga, al restablecer el pipeline se borra el registro de los archivos que está cargando el pipeline. Al llamar a START_PIPELINE o RUN_PIPELINE_ONCE después de restablecer un pipeline de carga, el pipeline repite la carga de datos e incluye todos los archivos presentes en la ubicación del almacén de objetos.

Cuando purge_data se define en TRUE, DBMS_CLOUD_PIPELINE.RESET_PIPELINE hace lo siguiente:
- Trunca los datos de la tabla de base de datos del pipeline que especifique con el atributo table_name.
- Borra la tabla de estado del pipeline, así como la tabla de archivos incorrecta y la tabla de errores del pipeline (si existen).
Para un pipeline de exportación, al restablecer el pipeline se borran los últimos datos con seguimiento en la tabla de la base de datos. Al llamar a START_PIPELINE o RUN_PIPELINE_ONCE después de restablecer un pipeline de exportación, el pipeline repite la exportación de datos de la tabla o consulta.

Cuando purge_data se define en TRUE, DBMS_CLOUD_PIPELINE.RESET_PIPELINE suprime los archivos existentes en la ubicación del almacén de objetos especificada con el atributo location.

Tema principal: Resumen de subprogramas DBMS_CLOUD_PIPELINE

RUN_PIPELINE_ONCE Procedimiento

Este procedimiento realiza una ejecución bajo demanda del pipeline en la sesión de primer plano actual, en lugar de una ejecución en un trabajo programado. Utilice DBMS_CLOUD_PIPELINE.RUN_PIPELINE_ONCE para probar un pipeline antes de iniciar el pipeline como un trabajo continuo.

Sintaxis

DBMS_CLOUD_PIPELINE.RUN_PIPELINE_ONCE(
       pipeline_name  IN  VARCHAR2
);

Parámetros

Parámetro Descripción

Parámetro	Descripción
`pipeline_name`	Especifica un nombre para que se ejecute el pipeline. Este parámetro es obligatorio.

pipeline_name

Especifica un nombre para que se ejecute el pipeline.

Este parámetro es obligatorio.

Notas de uso

Después de realizar una ejecución de prueba de un pipeline, puede restablecer el estado del pipeline mediante DBMS_CLOUD_PIPELINE.RESET_PIPELINE. Esto le permite restablecer el estado del pipeline antes de iniciar el pipeline en un trabajo programado.
Si un pipeline está en estado iniciado, no se puede ejecutar en la sesión de primer plano.

Tema principal: Resumen de subprogramas DBMS_CLOUD_PIPELINE

SET_ATTRIBUTE Procedimiento

Este procedimiento define los atributos de pipeline. Hay dos procedimientos sobrecargados, uno para definir un único atributo y otro para definir varios atributos mediante un documento JSON de pares de nombre/valor de atributo.

Sintaxis

PROCEDURE DBMS_CLOUD_PIPELINE.SET_ATTRIBUTE(
      pipeline_name        IN   VARCHAR2,
      attribute_name       IN   VARCHAR2,
      attribute_value      IN   CLOB
);
 
PROCEDURE DBMS_CLOUD_PIPELINE.SET_ATTRIBUTE(
      pipeline_name        IN   VARCHAR2,
      attributes           IN   CLOB
);

Parámetros

Parámetro	Descripción
`pipeline_name`	Especifica un nombre para que el pipeline defina atributos. Este parámetro es obligatorio.
`attribute_name`	Especifica el nombre del atributo que se va a definir. Consulte DBMS_CLOUD_PIPELINE Attributes para obtener más información.
`attribute_value`	Especifica el valor del atributo de pipeline que se va a definir. Consulte DBMS_CLOUD_PIPELINE Attributes para obtener más información.
`attributes`	Especifica un documento JSON que contiene valores y nombres de atributo. Consulte DBMS_CLOUD_PIPELINE Attributes para obtener más información.

Nota de uso

Cuando se utiliza DBMS_CLOUD_PIPELINE.SET_ATTRIBUTE para definir varios atributos con el parámetro attributes, todos los atributos existentes se suprimen y sobrescriben con los atributos especificados del documento JSON.

Tema principal: Resumen de subprogramas DBMS_CLOUD_PIPELINE

START_PIPELINE Procedimiento

El procedimiento inicia el pipeline de datos. Cuando se inicia un pipeline, la operación de pipeline se ejecuta continuamente en un trabajo programado según interval configurado con los atributos de pipeline.

Sintaxis

DBMS_CLOUD_PIPELINE.START_PIPELINE(
      pipeline_name        IN   VARCHAR2,
      start_date           IN   TIMESTAMP WITH TIME ZONE DEFAULT NULL
);

Parámetros

Parámetro Descripción

Parámetro	Descripción
`pipeline_name`	Especifica un nombre para el pipeline. Este parámetro es obligatorio.
`start_date`	Especifica la fecha de inicio del trabajo de pipeline. Valor por defecto: `NULL`

pipeline_name

Especifica un nombre para el pipeline.

Este parámetro es obligatorio.

start_date

Especifica la fecha de inicio del trabajo de pipeline.

Valor por defecto: NULL

Notas de uso

Por defecto, un trabajo de pipeline se inicia inmediatamente, tan pronto como se inicia el pipeline. Para iniciar un trabajo de pipeline más tarde, especifique una fecha o un registro de hora válidos mediante el parámetro start_date.
Consulte DBMS_CLOUD_PIPELINE Attributes para obtener información sobre el pipeline interval y otros atributos de pipeline.

Tema principal: Resumen de subprogramas DBMS_CLOUD_PIPELINE

STOP_PIPELINE Procedimiento

El procedimiento para el pipeline de datos. Cuando se para un pipeline, no se programan trabajos futuros para el pipeline.

Sintaxis

DBMS_CLOUD_PIPELINE.STOP_PIPELINE(
      pipeline_name        IN   VARCHAR2,
      force                IN   BOOLEAN  DEFAULT  FALSE
);

Parámetros

Parámetro Descripción

Parámetro	Descripción
`pipeline_name`	Especifica un nombre para el pipeline. Este parámetro es obligatorio.
`force`	Si el parámetro force se transfiere como `TRUE`, terminará cualquier trabajo en ejecución para el pipeline. Valores válidos: `TRUE, FALSE` Valor por defecto: `FALSE`

pipeline_name

Especifica un nombre para el pipeline.

Este parámetro es obligatorio.

force

Si el parámetro force se transfiere como TRUE, terminará cualquier trabajo en ejecución para el pipeline.

Valores válidos: TRUE, FALSE

Valor por defecto: FALSE

Tema principal: Resumen de subprogramas DBMS_CLOUD_PIPELINE

Atributos DBMS_CLOUD_PIPELINE

Los atributos ayudan a controlar y configurar el comportamiento de un pipeline de datos.

Atributos

Nota

Como se indica en la columna Tipo de pipeline, según el tipo de pipeline LOAD o EXPORT, un pipeline soporta un juego diferente de atributos.

Nombre de atributo	Descripción	Tipo de pipeline	Modificable después del inicio del pipeline
`credential_name`	Nombre de la credencial para acceder a Cloud Object Storage de origen. Puede utilizar `'OCI$RESOURCE_PRINCIPAL'` como `credential_name` cuando la entidad de recurso está activada. También se admiten credenciales especificadas con lo siguiente: Nombres de recursos de Amazon, Principal de servicio de Azure o Cuenta de servicio de Google. Consulte Configuración de políticas y roles para acceder a recursos para obtener más información. Valor por defecto: `NULL`. Si no proporciona `credential_name`, `credential_name` se define en `NULL`.	`LOAD`, `EXPORT`	Sí
`field_list`	Identifica los campos en los archivos de origen y sus tipos de datos. La sintaxis de este argumento es la misma que la cláusula `field_list` de las tablas externas normales de Oracle. Para obtener más información sobre `field_list`, consulte Oracle® Database Utilities. Valor por defecto: `NULL` El valor por defecto especifica los campos y sus tipos de dato están determinados por las columnas de la tabla especificada en el atributo `table_name`.	`LOAD`	Sí
`format`	Opciones que describen el formato del tipo de pipeline. Para un pipeline de carga, consulte DBMS_CLOUD Package Format Options. Para un pipeline de exportación, consulte DBMS_CLOUD Package Format Options for EXPORT_DATA El pump de datos `format` no está soportado para un pipeline de exportación. Este atributo es obligatorio para los pipelines `LOAD` y `EXPORT`.	`LOAD`, `EXPORT`	Sí
`interval`	Intervalo de tiempo en minutos entre ejecuciones consecutivas del trabajo de pipeline programado. Valor por defecto: 15 minutos	`LOAD`, `EXPORT`	Sí
`key_column`	Una columna de fecha o registro de hora en el valor `table` o `query` especificado para exportar datos más recientes continuamente al almacén de objetos. El pipeline de exportación realiza un seguimiento del último registro de hora o fecha de ejecución y se compara con el valor de `key_column` para identificar los nuevos datos que se van a exportar al almacén de objetos. Valor por defecto: NULL Si no se especifica `key_column` para un pipeline de exportación, todo el contenido de `table` o `query` se carga en el almacén de objetos de cada ejecución de trabajo de pipeline.	`EXPORT`	No
`location`	Este parámetro especifica una de las siguientes opciones: Lista delimitada por comas de los URI de archivo de origen Uno o más directorios y archivos de origen Puede utilizar comodines y expresiones regulares en los nombres de archivo de los URI de archivo de origen de nube. Este parámetro es obligatorio. URI de archivo de origen en la nube Este parámetro especifica una lista delimitada por comas de URI de archivo de origen o uno o más directorios y archivos de origen. Las expresiones regulares solo se pueden utilizar cuando el parámetro `regexuri` `format` está definido en `TRUE`. Los caracteres "" y "?" se consideran caracteres comodín cuando el parámetro `regexuri` se define en `FALSE`. Cuando el parámetro `regexuri` se define en `TRUE`, los caracteres "" y "?" forman parte del patrón de expresión regular especificado. Los patrones de expresión regular solo están soportados para el nombre de archivo o la ruta de subcarpeta en los URI y la coincidencia de patrones es idéntica a la realizada por la función `REGEXP_LIKE`. Ejemplo de uso de expresiones regulares: `location_uri => 'https://objectstorage.my$region.oraclecloud.com/n/namespace-string/b/bucketname/o(/)year=[0-9]+(/)month=[0-9]+(/)[a-z]+[1-3]??.csv'` Ejemplo de uso de comodines: `location_uri => 'https://objectstorage.my$region.oraclecloud.com/n/namespace-string/b/bucketname/o/year=????/month=??/.csv` El formato de los URI depende del servicio Cloud Object Storage que utilice, consulte Formatos DBMS_CLOUD de URI. Consulte Condición REGEXP_LIKE para obtener más información sobre la condición `REGEXP_LIKE`. Directorio Puede especificar un directorio y uno o más nombres de archivo o utilizar una lista separada por comas de directorios y nombres de archivo. El formato para especificar un directorio es:`'MY_DIR:filename.ext'`. Por defecto, el nombre de directorio `MY_DIR` es un objeto de base de datos y no distingue entre mayúsculas y minúsculas. El Nombre del Archivo es sensible a mayúsculas/minúsculas. Las expresiones regulares no están soportadas al especificar los nombres de archivo en un directorio. Solo puede utilizar comodines para especificar nombres de archivo en un directorio. Se puede usar el carácter "" como comodín para varios caracteres y el carácter "?" se puede utilizar como comodín para un solo carácter. Por ejemplo:`'MY_DIR:"` o `'MY_DIR:test?'` Para especificar varios directorios, utilice una lista separada por comas de directorios: por ejemplo:`'MY_DIR1:, MY_DIR2:test?'` Utilice comillas dobles para especificar un nombre de directorio sensible a mayúsculas/minúsculas. Por ejemplo:`'"my_dir1":, "my_dir2":Test?'` Para incluir un carácter de comillas, utilice dos comillas. Por ejemplo:`'MY_DIR:''filename.ext'`. Especifica que `filename` empieza por una comilla (`'`). Nota El formato de directorio para el atributo `location` no se puede aplicar mediante el procedimiento `DBMS_CLOUD_PIPELINE.CREATE_PIPELINE` para crear pipelines de exportación. Este atributo es obligatorio para los pipelines `LOAD` y `EXPORT`.	`LOAD`, `EXPORT`	No
`priority`	Especifica un valor de cadena que determina el número de operaciones paralelas realizadas para el pipeline. En un pipeline de carga, determina el número de archivos cargados en paralelo. En un pipeline de exportación, determina el grado de paralelismo para recuperar datos de la base de datos. Una operación con una prioridad más alta consume más recursos de base de datos y se completa antes. Valores válidos: `HIGH`: determina el número de archivos paralelos manejados mediante el recuento de ECPU de la base de datos (recuento de OCPU si la base de datos utiliza OCPU). `MEDIUM`: determina el número de procesos simultáneos que utilizan el límite de simultaneidad para el servicio Medium. El valor por defecto es 4. `LOW`: ejecute el trabajo de pipeline en orden de serie. Valor por defecto: `MEDIUM` El número máximo de operaciones de archivo simultáneas está limitado a 64.	`LOAD`, `EXPORT`	Sí
`query`	Especifica una sentencia `SELECT` para que solo se exporten los datos necesarios. La consulta determina el contenido de los archivos que se exportan como archivos de texto (CSV, JSON, Parquet o XML) o archivos de volcado. Por ejemplo: `SELECT warehouse_id, quantity FROM inventories` Valor por defecto: `NULL` Para un pipeline de exportación, `table_name` o `query` son obligatorios.	`EXPORT`	No
`table_name`	Especifica el nombre de la tabla de destino para cargar o exportar datos. Para un pipeline de carga, `table_name` es obligatorio. Para un pipeline de exportación, `table_name` o `query` son obligatorios.	`LOAD`, `EXPORT`	No
`table_owner`	Nombre del esquema en el que reside la tabla de destino para cargar o exportar datos. Valor por defecto: `NULL` Con un valor `NULL`, la tabla destino está en el mismo esquema que el usuario que ejecuta el procedimiento.	`LOAD`, `EXPORT`	No

Tema principal: Paquete DBMS_CLOUD_PIPELINE

DBMS_CLOUD_PIPELINE Vistas

El paquete DBMS_CLOUD_PIPELINE utiliza las siguientes vistas.

Tema principal: Paquete DBMS_CLOUD_PIPELINE

Documentación de Oracle Cloud Infrastructure

Paquete DBMS_CLOUD_PIPELINE

Resumen de Subprogramas DBMS_CLOUD_PIPELINE

CREATE_PIPELINE Procedimiento

DROP_PIPELINE Procedimiento

RESET_PIPELINE Procedimiento

RUN_PIPELINE_ONCE Procedimiento

SET_ATTRIBUTE Procedimiento

START_PIPELINE Procedimiento

STOP_PIPELINE Procedimiento

Atributos DBMS_CLOUD_PIPELINE

DBMS_CLOUD_PIPELINE Vistas