Enlace a objetos de almacenamiento en la nube

Al crear un enlace a los archivos de un cubo de almacén en la nube desde la base de datos de Oracle Autonomous, cree una tabla externa que enlace a los archivos del almacén en la nube.

Puede enlazar a archivos en estos formatos de archivo: AVRO, CSV, JSON, GeoJSON, Parquet, ORC, TXT delimitado. Para obtener información sobre los formatos de archivo soportados, consulte Especificaciones de formato para archivos JSON, AVRO y XML.

Configure y ejecute un trabajo de enlace de datos en la página Objeto de nube de enlace. Para abrir esa página:

  1. Abra la pantalla de inicio de Database Actions, haga clic en el separador Data Studio y seleccione el menú Carga de datos. Consulte Página Carga de datos.
  2. Seleccione LINK DATA y CLOUD STORE.

En el lado izquierdo de la página hay un panel de navegación, donde puede seleccionar una conexión al almacén en la nube y las carpetas o los archivos que contienen los datos. A la derecha de la página está el carrito de carga de datos, donde almacena en área temporal los archivos y carpetas del trabajo de enlace de datos. Puede definir opciones para el trabajo de enlace de datos antes de ejecutarlo. Autonomous Database incluye recursos compartidos de CPU o E/S predefinidos asignados a diferentes grupos de consumidores. Puede definir el grupo de consumidores en bajo, medio o alto al ejecutar un trabajo de carga de datos en función de la carga de trabajo.

Para enlazar a archivos de un almacén en la nube, realice lo siguiente:

Gestión de enlaces de almacenamiento en la nube para trabajos de enlace de datos

Para poder enlazar a datos de un almacén en la nube, debe establecer una conexión con el almacén en la nube que desea utilizar.

En la página enlazar objeto en la nube:

  1. Haga clic en el icono Gestionar tienda en la nube junto al campo en el que introduce la ubicación de la tienda en la nube. Seleccione + Crear ubicación de almacenamiento en la nube.

  2. Introduzca la información en el panel Agregar ubicación de almacén en la nube. Consulte para agregar una ubicación de almacenamiento en la nube.

Consulte Gestión de conexiones.

Para volver a la página Enlazar objeto en la nube, haga clic en Carga de datos en las rutas de navegación de la parte superior de la página y, a continuación, vuelva a la página.

Preparación del trabajo de enlace de datos

Puede que tenga que ajustar los datos de origen o la tabla de destino para que los datos de origen se enlacen correctamente a la tabla de destino externa. Debe:

  • Si está enlazando a varios archivos, debe asegurarse de que:

    • Todos los archivos de origen son del mismo tipo, por ejemplo, CSV, JSON, etc.

    • El número, el orden y los tipos de datos de las columnas de todos los archivos de origen coinciden.

  • Si desea crear una partición por fecha:

    • El archivo de origen debe contener datos cuyo tipo sea fecha o registro hora.

    • Debe cargar una carpeta que contenga dos o más orígenes de datos.

    • Los nombres de los archivos de la carpeta deben indicar una fecha o fechas, por ejemplo, MAR-1999.csv o 2017-04-21.xlsx.

Adición de archivos o carpetas para el trabajo de enlace de datos

Agregue archivos del almacén en la nube al carrito de enlace de datos, donde puede editar los detalles del trabajo de enlace de datos. Para agregar los archivos:

  1. En la parte superior del panel del navegador de la izquierda, seleccione el cubo con los datos de origen.

    En la lista se muestran los enlaces establecidos en la página Gestionar Cloud Storage. Si aún no ha registrado el almacén en la nube que desea utilizar, haga clic en el botón Conexiones del menú Carga de datos del conjunto de herramientas de Data Studio y registre una conexión.

  2. Arrastrar uno o más elementos del navegador de archivos situado a la izquierda y soltarlos en el carrito situado a la derecha.

    • Puede agregar archivos, carpetas o ambos elementos. Se agrega una tarjeta al carrito por cada archivo o carpeta que arrastre a él. En la tarjeta se muestra el nombre del archivo o carpeta de origen y el nombre propuesto para la tabla de destino.

    • Si agrega una carpeta que contiene varios archivos, todos los archivos deben ser del mismo tipo, es decir, CSV, TXT, etc.

      Al agregar la carpeta al carrito, se muestra una petición de datos que pregunta si desea cargar todos los objetos de varios archivos de origen en una única tabla de destino. Haga clic en para continuar, o en No para cancelar.

    • Al agregar varios archivos individuales o varias carpetas al carro, los datos representados por cada tarjeta se cargarán en una tabla independiente, pero todos los artículos del carro se procesarán como parte del mismo trabajo de carga de datos.

    • Puede agregar archivos o carpetas de un cubo diferente, pero si lo hace, se le pedirá que elimine todos los archivos que ya estén en el carrito antes de continuar. Para seleccionar archivos de un cubo diferente, seleccione el cubo en la lista desplegable del panel del navegador de la izquierda y, a continuación, agregue los archivos, como se ha descrito anteriormente.

    • Puede soltar archivos o carpetas en el carrito de carga de datos y, a continuación, salir de la página Objeto de enlace de datos. Al volver a la página, esos elementos permanecen en ella, pero puede que aparezca un mensaje: "Elimine todos los elementos de enlace de datos". Para cambiar a otra ubicación de almacenamiento en la nube es necesario suprimir todos los elementos del trabajo de carga de datos. ¿Desea continuar?" Haga clic en para eliminar los artículos del carrito. Haga clic en No para mantener los artículos en el carrito. A continuación, podrá seguir trabajando.

Puede eliminar artículos del carrito antes de ejecutar el trabajo de enlace de datos:

  • Para eliminar un elemento del carrito, seleccione Eliminar en la tarjeta de la barra de menús del carrito de enlace de datos del artículo en la parte superior del panel.

  • Para eliminar todos los elementos del carrito, haga clic en Eliminar todo en la barra de menús del carrito de enlace de datos en la parte superior del panel.

Introducción de los detalles del trabajo de enlace de datos

Introduzca los detalles sobre el trabajo de enlace de datos en el panel Enlazar datos de almacenamiento en la nube.

En la tarjeta del carrito del enlace de datos, haga clic en Configuración para abrir el panel Enlace de datos del panel Cloud Storage para ese trabajo. El panel contiene:

Separador Configuración: sección Tabla

Defina los detalles sobre la tabla de destino en la sección Tabla.

  • Nombre: nombre de la tabla de destino.
  • Partition Column:

    Las particiones de lista y las particiones basadas en fecha son los diferentes tipos de particiones disponibles en el enlace de datos.

    La partición de lista es necesaria cuando desee asignar específicamente filas a particiones en función de valores discretos.

    Para realizar la partición según una columna específica, haga clic en la lista desplegable Columna de partición y seleccione la columna que desea utilizar para la partición.

    Tendrá N archivos por valor de partición, todos particionados por la columna de partición que seleccione.

    Nota

    • Para los archivos enlazados (de tablas externas) también es necesario que para cada archivo, la columna de partición de lista solo pueda contener un único valor distinto en todas las filas.
    • Si un archivo está particionado por lista, la clave de partición solo puede constar de una sola columna de la tabla.

    La partición basada en fecha está disponible al enlazar una carpeta que contenga dos o más orígenes de datos que tengan columnas que contengan datos de fecha o de registro de hora.

    Para realizar la partición según la fecha, haga clic en la lista desplegable Columna de partición y seleccione la columna DATE o TIMESTAMP que desea utilizar para la partición.

  • Tipo de validación: la validación examina los archivos de origen, la información de partición opcional y las filas de informes que no coinciden con las opciones de formato especificadas. Seleccione Ninguno para no realizar ninguna validación; seleccione Ejemplo para realizar la validación basada en un ejemplo de los datos; o seleccione Completa para realizar la validación basada en todos los datos.

  • Usar comodín: esta casilla de control permite el uso de caracteres comodín en la condición de búsqueda para recuperar un grupo específico de archivos que coincida con los criterios de filtro.

    Puede utilizar un carácter comodín, como un asterisco (*), para buscar, filtrar y especificar grupos de archivos que detectan y agregan nuevos archivos a la tabla externa.

    Por ejemplo, si introduce file*, se considera que file01, file02, file03, etc. coinciden con la palabra clave. El asterisco (*) coincide con cero o más caracteres de las posibilidades, con la palabra clave.

    Nota

    El soporte de comodines es incompatible con la partición. La validación del archivo de origen falla si utiliza comodines con datos particionados.

Separador Configuración: sección Propiedades

Especifique opciones para controlar cómo se interpretan, previsualizan y procesan los datos de origen. Estas opciones varían en función del tipo de datos de origen.

  • codificación: seleccione un tipo de codificación de caracteres de la lista. Esta opción está disponible cuando el archivo vinculado tiene formato de texto sin formato (CSV, TSV o TXT). El tipo de codificación por defecto es UTF-8.

  • Cierre de texto: seleccione el carácter para delimitar el texto: " (comilla doble), ' (comilla única) o Ninguno. Esta opción solo está visible cuando el archivo seleccionado está en formato de texto sin formato (CSV, TSV o TXT).

  • Delimtador de campo: seleccione el carácter delimitador utilizado para separar las columnas en el origen. Por ejemplo, si el archivo de origen utiliza puntos y comas para delimitar las columnas, seleccione Punto y coma en esta lista. El valor por defecto es Coma. Esta opción solo está visible cuando el archivo seleccionado está en formato de texto sin formato (CSV, TSV o TXT).

  • Iniciar procesamiento de datos en fila: especifica el número de filas que se saltarán al enlazar los datos de origen a la tabla externa de destino:

    • Si selecciona la opción Fila de cabecera de columna en Nombre de columna de origen (consulte a continuación) y si introduce un número mayor que 0 en el campo Iniciar procesamiento de datos en fila, ese número de filas después de la primera fila no se enlazan al destino.

    • Si anula la selección de la opción Fila de cabecera de columna en Nombre de columna de origen y si introduce un número mayor que 0 en el campo Iniciar procesamiento de datos en fila, ese número de filas, incluida la primera fila, no se enlazan al destino.

  • Nombre de columna de origen: seleccione la casilla de control Fila de cabecera de columna para utilizar los nombres de columna de la tabla de origen en la tabla de destino.

    • Si selecciona esta opción, la primera fila del archivo se procesa como nombres de columna. Las filas de la sección Asignación, a continuación, se rellenan con esos nombres (y con los tipos de dato existentes, a menos que los cambie).

    • Si anula la selección de esta opción, la primera fila se procesa como datos. Para especificar los nombres de columna manualmente, introduzca un nombre para cada columna de destino en la sección Asignación. (También tendrá que introducir los tipos de datos.)

  • Columna numérica: seleccione la casilla de control Convertir datos no válidos en nulos para convertir un valor de columna numérica no válido en un valor nulo.

  • Líneas nuevas incluidas en los valores de datos: seleccione esta opción si hay caracteres de línea nueva o si vuelve al principio de la línea actual sin avanzar hacia abajo en los campos de datos. Si selecciona esta opción, aumentará el tiempo que se tarda en procesar la carga. Si no selecciona esta opción al cargar los datos, se rechazarán las filas con líneas nuevas en los campos. Puede ver la fila rechazada en el panel Informe de trabajo.

Separador Configuración: sección Asignación

La configuración de la sección Asignación controla cómo se enlazan los datos de los archivos de origen a las filas de la tabla externa de destino. Para cada fila, los datos de la columna que se muestra en Columna de origen se enlazarán a la columna que se muestra en Columna de destino.

  • Columna de origen: muestra las columnas del archivo de origen.

    Si la opción Fila de cabecera de columna en Propiedades está seleccionada, en Columna de origen se muestran los nombres de las columnas en el archivo de origen. Si la opción Fila de cabecera de columna no está seleccionada, se utilizan nombres genéricos como COLUMN_1, COLUMN_2, etc. Este campo siempre es de solo lectura.

    Puede ver dos columnas de origen FILE$NAME y SYSTIMESTAMP. La columna FILE$NAME permite localizar el archivo de origen que contiene un registro de datos concreto. Por ejemplo, puede cargar un archivo de origen que contenga una lista de archivos. Los nombres de archivo de la lista de archivos hacen referencia a los nombres de departamento de toda la organización. Por ejemplo, un archivo finance.txt contiene datos del departamento de finanzas. En la asignación, puede utilizar tipos de dato de cadena para extraer el nombre de departamento de la salida de la columna de nombre de archivo. Puede utilizar el nombre del departamento extraído para procesar los datos de forma diferente para cada departamento.

    La columna SYSTIMESTAMP nos permite ver el registro de hora actual en la base de datos.

    Nota

    • Las columnas de origen FILE$NAME y SYSTIMESTAMP no se incluyen por defecto. Debe activar la casilla de control Incluir y ejecutar la carga para que la tabla de destino muestre estas dos columnas.
    • Al crear una fuente activa, las columnas de origen FILE$NAME y SYSTIMESTAMP aparecen por defecto en la tabla Asignación.
  • Columna de destino: muestra las columnas de la tabla de destino.

    • Si la opción Column header row está seleccionada, la columna de destino utiliza los nombres de las columnas del archivo de origen. Puede cambiar el nombre de una columna de destino reemplazando el nombre proporcionado por uno nuevo. Debe asegurarse de que la columna de destino no esté vacía. El nombre de columna de destino no debe ser un duplicado de otra columna de destino. El nombre de columna de destino no puede tener un nombre duplicado como otra columna de destino. La longitud de la columna de destino no debe superar los 128 bytes. El límite de 128 bytes es un límite de base de datos.

    • If the Column header row option is not selected, then generic names like COLUMN_1, COLUMN_2, etc., are used. Puede cambiar el nombre de una columna de destino reemplazando el nombre proporcionado por uno nuevo.

    Nota

    Si está enlazando varios archivos desde una carpeta en un único trabajo de enlace de datos, solo se mostrará el primer archivo en la sección Asignación. Sin embargo, siempre que los nombres de columna y los tipos de dato coincidan, se enlazarán los datos de todos los archivos de origen.

  • Tipo de datos: muestra el tipo de datos que se va a utilizar para los datos de esa columna. El contenido cambia según si la opción Obtener de la cabecera de archivo está seleccionada.

    • Si la opción Columna de fila de cabecera está seleccionada, en Tipo de datos se muestran los tipos de datos de las columnas del archivo de origen. Si desea cambiar el tipo de datos del destino, haga clic en el nombre y seleccione uno diferente de la lista.

    • Si la opción Fila de cabecera de columna no está seleccionada, en Tipo de datos se muestran todos los tipos de datos disponibles. Seleccione el tipo de datos que desea utilizar para la columna de destino en la lista.

  • Length/Precision (Optional): For columns where the Data Type is NUMBER, enter the length/precision for the numbers in the column. La precisión es el número de dígitos significativos en un número. La precisión puede oscilar entre 1 y 38.

    Para las columnas en las que Tipo de datos es VARCHAR2, el valor Automático del campo Longitud/Precisión activa la función Tamaño automático.

    Con la función Ajustar ancho de columna automáticamente, puede cambiar el tamaño de cualquier columna para que se ajuste al valor más grande de la columna. Seleccione Automático en los valores desplegables Longitud/Precisión o seleccione un valor en la lista desplegable.

  • Escala (opcional): para las columnas en las que el tipo de datos es NUMBER, introduzca la escala para los números de la columna. La escala es el número de dígitos a la derecha ( positivo) o a la izquierda ( negativo) de la coma decimal. La escala puede estar entre -84 y 127.

  • Formato: si el tipo de datos de la columna Tipo de datos es DATE o uno de los tipos TIMESTAMP, seleccione un formato para ese tipo en la lista desplegable Formato.

Separador Vista previa

El menú Vista previa de carga del separador Vista previa muestra los datos de origen en formato tabular. La pantalla refleja la configuración seleccionada en la sección Propiedades. El menú Archivo muestra los datos de origen con los nombres de columna.

Si arrastró una carpeta que contiene varios archivos al carrito de enlace de datos y, a continuación, hizo clic en Valores Configuración para esa tarjeta, el panel Vista previa incluye una lista desplegable Vista previa de objeto (archivo) en la parte superior del panel que muestra todos los archivos de la carpeta. Seleccione el archivo de origen del que desea obtener una vista previa en esa lista.

Separador Tabla

En el separador Tabla se muestra el aspecto que se espera que tenga la tabla de destino después de enlazar los datos.

Separador SQL

En el separador SQL se muestran los comandos SQL que se ejecutarán para completar este trabajo de enlace de datos.

Nota

Puede ver el código SQL incluso antes de crear la tabla.

Botón Cerrar: Guardar y cerrar

Después de introducir todos los detalles del trabajo de enlace de datos, haga clic en Cerrar en la parte inferior de la página. Esto guarda los detalles introducidos y le devuelve al panel Enlazar datos desde almacenamiento en la nube.

Ejecución del trabajo de enlace de datos

Una vez que haya agregado orígenes de datos al carrito de enlace de datos e introducido detalles sobre el trabajo de enlace de datos, puede ejecutar el trabajo.

Para ejecutar el trabajo:

  1. Si aún no lo ha hecho, haga clic en el botón Cerrar del panel Enlazar datos desde almacenamiento en la nube para guardar la configuración y cerrar el panel. Si alguna de las configuraciones no es válida, aparece un mensaje de error que informa del problema. Solucione el problema y haga clic en Cerrar.
  2. Haga clic en Inicio Iniciar en la barra de menús del carrito del enlace de datos. Para parar el trabajo de enlace de datos, haga clic en Parar Parar.

    Cuando se complete el trabajo de enlace de datos, en la página Panel de control de carga de datos se muestran los resultados del trabajo en la sección Cargas de tablas y vistas.

    Una vez iniciado el trabajo de enlace de datos, puede ver el progreso del trabajo en el panel de control Carga de datos.

Visualización de detalles sobre el trabajo de enlace de datos después de su ejecución

Puede ver el progreso del trabajo en el panel de control Carga de datos.

Cuando se complete el trabajo de carga de datos, en la página del panel de control Carga de datos se muestran los resultados del trabajo. En la parte superior de la cabecera de la carga de la tabla, puede ver el nombre de la tabla junto con el total de columnas presentes en la tabla.

Haga clic en Informe de trabajo para ver el número total de filas procesadas correctamente y el recuento de filas rechazadas. También puede ver la hora de inicio. El panel SQL del informe de trabajo muestra el código SQL equivalente del trabajo.

Para ver información sobre un elemento del trabajo, haga clic en el icono Acciones de Carga de tabla.

Para ver un log de la operación de carga, haga clic en el icono Registro. Puede guardar el log, borrarlo o refrescarlo. Haga clic en Aceptar para cerrar el log.

Visualización de la tabla resultante del trabajo de enlace de datos

Después de ejecutar un trabajo de enlace de datos, puede ver la tabla creada por el trabajo de enlace de datos en el panel de control Carga de datos.

Fix su trabajo de carga de datos. Después del trabajo de carga de datos, es posible que vea errores que desee corregir o que, tras la inspección, se dé cuenta de que desea asignar un nombre a una columna de forma diferente. En estos casos, haga clic en la opción Recargar de la carga de tabla seleccionada para volver a cargar las tarjetas del carrito reciente y editarlas como lo hizo antes del primer intento. El icono Volver a cargar vuelve a cargar los datos de origen con las correcciones sugeridas por la herramienta. Haga clic en el icono Acciones de la cabecera Tabla, haga clic en Tabla y seleccione Editar para realizar cambios en el trabajo de carga de datos (por ejemplo, cambiar el nombre de una columna).