Enlace a datos de almacenamiento en la nube
Al crear un enlace a archivos en un cubo del almacén en la nube a partir de la base de datos autónoma de Oracle, se crea una tabla externa que enlaza a los archivos del almacén en la nube.
Puede enlazar a archivos en estos formatos de archivo: AVRO, CSV, JSON, GeoJSON, Parquet, ORC, Delimited TXT. Para obtener información sobre los formatos de archivo soportados, consulte Format Specifications for JSON, AVRO, and XML Files.
Configure y ejecute un trabajo de enlace de datos desde la página Objeto de enlace en la nube. Para abrir esa página:
- Abra la pantalla de inicio de Database Actions, haga clic en el separador Data Studio y seleccione el menú Carga de datos. Consulte Página Carga de Datos.
- Seleccione DATOS DE ENLACE y Tienda en la nube.
En el lado izquierdo de la página hay un panel de navegación, donde puede seleccionar una conexión de almacén en la nube y las carpetas o archivos que contienen los datos. A la derecha de la página se encuentra el carro de carga de datos, donde almacena en área temporal los archivos y carpetas para el trabajo de enlace de datos. Puede definir opciones para el trabajo de enlace de datos antes de ejecutarlo. Autonomous Database incluye recursos compartidos predefinidos de CPU/E/S asignados a diferentes grupos de consumidores. Puede definir el grupo de consumidores en bajo, medio o alto al ejecutar un trabajo de carga de datos en función de la carga de trabajo.
- Gestión de enlaces de almacenamiento en la nube para trabajos de enlace de datos
Para poder enlazar a datos de un almacén en la nube, debe establecer una conexión con el almacén en la nube que desea utilizar. - Preparación del trabajo de enlace de datos
- Adición de Archivos o Carpetas para el Trabajo de Enlace de Datos
- Introducir detalles para el trabajo de enlace de datos
Introduzca los detalles sobre el trabajo de enlace de datos en el panel Datos de enlace de Cloud Storage. - Ejecute el trabajo de enlace de datos
Una vez que haya agregado orígenes de datos al carro de enlaces de datos y haya introducido detalles sobre el trabajo de enlace de datos, puede ejecutar el trabajo. - Visualización de detalles sobre el trabajo de enlace de datos después de su ejecución
Puede ver el progreso del trabajo en el panel de control Carga de datos. - Visualización de la tabla resultante del trabajo de enlace de datos
Después de ejecutar un trabajo de enlace de datos, puede ver la tabla creada por el trabajo de enlace de datos en el panel de control de carga de datos.
Tema principal: Enlace de datos
Gestionar enlaces de almacenamiento en la nube para trabajos de enlace de datos
Para poder enlazar a los datos de un almacén en la nube, debe establecer una conexión con el almacén en la nube que desea utilizar.
En la página Link Cloud Object:
-
Haga clic en el icono Gestionar almacén en la nube además del campo en el que se introduce la ubicación del almacén en la nube. Seleccione + Crear ubicación del almacén en la nube.
-
Introduzca la información en el panel Agregar ubicación de almacén en la nube. Consulte para agregar una ubicación de almacenamiento en la nube.
Consulte Gestión de conexiones.
Para volver a la página Enlazar objeto en la nube, haga clic en Carga de datos en las rutas de navegación de la parte superior de la página y, a continuación, vuelva a la página.
Tema principal: Enlace a objetos en Cloud Storage
Preparación del trabajo de enlace de datos
Puede que tenga que ajustar los datos de origen o la tabla de destino para que los datos de origen se vinculen correctamente a la tabla de destino externa. Debe:
-
Si está enlazando a varios archivos, debe asegurarse de que:
-
Todos los archivos de origen son del mismo tipo, por ejemplo, CSV, JSON, etc.
-
El número, el orden y los tipos de dato de las columnas de todos los archivos de origen coinciden.
-
-
Si desea particionar por fecha:
-
El archivo de origen debe contener datos en los que el tipo de dato es fecha o registro de hora.
-
Debe cargar una carpeta que contenga dos o más orígenes de datos.
-
Los nombres de los archivos de la carpeta deben indicar una fecha o fechas, por ejemplo,
MAR-1999.csv
o2017-04-21.xlsx
.
-
Tema principal: Enlace a objetos en Cloud Storage
Adición de archivos o carpetas para el trabajo de enlace de datos
Agregue archivos del almacén en la nube al carro de enlace de datos, donde puede editar los detalles del trabajo de enlace de datos. Para agregar los archivos:
-
En la lista de la parte superior del panel del navegador de la izquierda, seleccione el cubo con los datos de origen.
La lista muestra los enlaces que se establecieron en la página Gestionar almacenamiento en la nube. Si aún no ha registrado el almacén en la nube que desea utilizar, haga clic en el botón Conexiones en el menú Carga de datos del conjunto de herramientas de Data Studio y registre una conexión.
-
Arrastre uno o más elementos desde el navegador de archivos de la izquierda y suéltelos en el carro de la derecha.
-
Puede agregar archivos, carpetas o ambos. Se agrega una tarjeta al carro para cada archivo o carpeta que arrastre en él. La tarjeta muestra el nombre del archivo o carpeta de origen y un nombre propuesto para la tabla de destino.
-
Si agrega una carpeta que contiene varios archivos, todos los archivos deben ser del mismo tipo, es decir, CSV, TXT, etc.
Al agregar la carpeta al carro, se muestra una petición de datos que le pregunta si desea cargar todos los objetos de los varios archivos de origen en una única tabla de destino. Haga clic en Sí para continuar, o enNo para cancelar.
-
Al agregar varios archivos individuales o varias carpetas al carro, los datos representados por cada tarjeta se cargarán en una tabla independiente, pero todos los elementos del carro se procesarán como parte del mismo trabajo de carga de datos.
-
Puede agregar archivos o carpetas de un cubo diferente, pero si lo hace, se le pedirá que elimine todos los archivos que ya estén en el carro antes de continuar. Para seleccionar archivos de un cubo diferente, seleccione el cubo de la lista desplegable del panel del navegador de la izquierda y, a continuación, agregue los archivos, como se describió anteriormente.
-
Puede soltar archivos o carpetas en el carro de carga de datos y, a continuación, salir de la página Objeto de enlace de datos. Al volver a la página, esos elementos permanecen en la página, pero puede que reciba un mensaje, "Eliminar todos los elementos de enlace de datos". Para cambiar a otra ubicación de almacenaje de la nube, es necesario eliminar todos sus elementos del trabajo. ¿Desea continuar?" Haga clic en Sí para eliminar los artículos del carro. Haga clic en No para mantener los artículos en el carro. Entonces puedes seguir trabajando.
-
Puede eliminar artículos del carro antes de ejecutar el trabajo de enlace de datos:
-
Para eliminar un artículo del carro, seleccione Eliminar en la tarjeta de la barra de menú del carro de enlace de datos del artículo en la parte superior del panel.
-
Para eliminar todos los artículos del carro, haga clic en Eliminar todo en la barra de menús del carro del enlace de datos en la parte superior del panel.
Tema principal: Enlace a objetos en Cloud Storage
Introducción de detalles para el trabajo de enlace de datos
Introduzca los detalles sobre el trabajo de enlace de datos en el panel Enlazar datos de Cloud Storage.
En la tarjeta del carro de enlace de datos, haga clic en Configuración para abrir el panel Enlazar datos de almacenamiento en la nube para ese trabajo. El panel contiene:
Ficha Configuración - Sección de tabla
Defina los detalles sobre la tabla de destino en la sección Tabla.
- Nombre: nombre de la tabla de destino.
-
Columna de Partición:
Las particiones de lista y basadas en fecha son los diferentes tipos de particiones disponibles en el enlace de datos.
La partición de listas es necesaria cuando se desea asignar filas específicamente a particiones basadas en valores discretos.
Para realizar una partición según una columna específica, haga clic en la lista desplegable Columna de partición y seleccione la columna que desea utilizar para la partición.
Tendrá N archivos por valor de partición, todos particionados por la columna de partición que seleccione.
Nota
- Para los archivos enlazados (de tablas externas) también es necesario que, para cada archivo, la columna de partición de lista sólo pueda contener un único valor distinto en todas las filas.
- Si un archivo está particionado en una lista, la clave de partición solo puede constar de una sola columna de la tabla.
La partición basada en fecha está disponible al enlazar una carpeta que contiene dos o más orígenes de datos que tienen columnas que contienen datos de fecha o registro de hora.
Para realizar la partición según la fecha, haga clic en la lista desplegable Columna de partición y seleccione la columna DATE o TIMESTAMP que desea utilizar para la partición.
-
Tipo de validación: la validación examina los archivos de origen, la información de partición opcional y los informes que no coinciden con las opciones de formato especificadas. Seleccione Ninguno para que no haya validación; seleccione Ejemplo para realizar la validación basada en un ejemplo de los datos; o seleccione Completo para realizar la validación basada en todos los datos.
- Usar comodín: esta casilla de control permite el uso de caracteres comodín en la condición de búsqueda para recuperar un grupo específico de archivos que coincida con los criterios de filtro.
Puede utilizar un carácter comodín, como un asterisco (*) que busca, filtra y especifica grupos de archivos que detectan y agregan nuevos archivos a la tabla externa.
Por ejemplo, si introduce file*, se considera que file01, file02, file03, etc. coinciden con la palabra clave. El asterisco (*) coincide con cero o más caracteres de las posibilidades, con la palabra clave.
Nota
El soporte de comodines no es compatible con la partición. La validación del archivo de origen falla si utiliza comodines con datos particionados.
Separador Configuración: Sección Propiedades
Especifique opciones para controlar cómo se interpretan, previsualizan y procesan los datos de origen. Estas opciones varían en función del tipo de datos de origen.
-
Codificación: seleccione un tipo de codificación de caracteres de la lista. Esta opción está disponible cuando el archivo vinculado está en formato de texto sin formato (CSV, TSV o TXT). El valor de codificación por defecto es UTF-8.
-
Contenido de texto: seleccione el carácter para delimitar el texto: " (carácter de comilla doble), ' (carácter de comilla simple) o Ninguno. Esta opción sólo está visible cuando el archivo seleccionado está en formato de texto sin formato (CSV, TSV o TXT).
-
Delimitador de campo: seleccione el carácter delimitador utilizado para separar columnas en el origen. Por ejemplo, si el archivo de origen utiliza puntos y coma para delimitar las columnas, seleccione Semicolon en esta lista. El valor predeterminado es Comma. Esta opción sólo está visible cuando el archivo seleccionado está en formato de texto sin formato (CSV, TSV o TXT).
-
Iniciar procesamiento de datos en fila: especifica el número de filas que se deben omitir al enlazar los datos de origen a la tabla externa de destino:
-
Si selecciona la opción Fila de cabecera de columna en Nombre de columna de origen (consulte a continuación) y si introduce un número mayor que 0 en el campo Iniciar procesamiento de datos en fila, ese número de filas después de la primera fila no estará enlazado al destino.
-
Si anula la selección de la opción Fila de cabecera de columna en Nombre de columna de origen, y si introduce un número mayor que 0 en el campo Iniciar procesamiento de datos en fila, ese número de filas, incluida la primera fila, no estará enlazado al destino.
-
-
Nombre de columna de origen: seleccione la casilla de control Fila de cabecera de columna para utilizar los nombres de columna de la tabla de origen en la tabla de destino.
-
Si selecciona esta opción, la primera fila del archivo se procesa como nombres de columna. Las filas de la sección Asignación, a continuación, se rellenan con esos nombres (y con los tipos de dato existentes, a menos que los cambie).
-
Si anula la selección de esta opción, la primera fila se procesa como datos. Para especificar nombres de columna manualmente, introduzca un nombre para cada columna de destino en la sección Asignación. (También tendrá que introducir tipos de dato).
-
-
Columna numérica: seleccione la casilla de control Convertir datos no válidos en nulospara convertir un valor de columna numérica no válido en un valor nulo.
-
Nuevas líneas incluidas en los valores de datos: seleccione esta opción si hay caracteres de línea nueva o si vuelve al principio de la línea actual sin avanzar hacia abajo en los campos de datos. Si selecciona esta opción, aumentará el tiempo que se tarda en procesar la carga. Si no selecciona esta opción al cargar los datos, se rechazarán las filas con líneas nuevas en los campos. Puede ver la fila rechazada en el panel Informe de trabajo.
Separador Configuración: Sección Asignación
La configuración de la sección Asignación controla cómo se enlazan los datos de los archivos de origen a las filas de la tabla externa de destino. Para cada fila, los datos de la columna que aparece en Columna de origen se enlazarán a la columna que aparece en Columna de destino.
-
Columna de origen: muestra las columnas del archivo de origen.
Si se selecciona la opción Fila de cabecera de columna en Propiedades, Columna de origen muestra los nombres de las columnas en el archivo de origen. Si no se selecciona la opción Fila de cabecera de columna, se utilizan nombres genéricos como COLUMN_1, COLUMN_2, etc. Este campo siempre es de solo lectura.
Puede ver dos columnas de origen
FILE$NAME
ySYSTIMESTAMP
. La columnaFILE$NAME
permite localizar el archivo de origen que contiene un registro de datos concreto. Por ejemplo, puede cargar un archivo de origen que contenga una lista de archivos. Los nombres de archivo de la lista de archivos hacen referencia a los nombres de departamento de toda la organización. Por ejemplo, un archivo finance.txt contiene datos del departamento de finanzas. En la asignación, puede utilizar tipos de dato de cadena para extraer el nombre de departamento de la salida de la columna de nombre de archivo. Puede utilizar el nombre de departamento extraído para procesar los datos de forma diferente para cada departamento.La columna
SYSTIMESTAMP
nos permite ver el registro de hora actual en la base de datos.Nota
- Las columnas de origen
FILE$NAME
ySYSTIMESTAMP
no se incluyen por defecto. Debe marcar la casilla de control Incluir y ejecutar la carga para que la tabla de destino muestre estas dos columnas. - Al crear una fuente activa, las columnas de origen
FILE$NAME
ySYSTIMESTAMP
aparecen por defecto en la tabla Asignación.
- Las columnas de origen
-
Columna de destino: muestra las columnas de la tabla de destino.
-
Si la opción fila de cabecera de columna está seleccionada, la columna de destino utiliza los nombres de las columnas del archivo de origen. Puede cambiar el nombre de una columna de destino sustituyendo el nombre proporcionado por uno nuevo. Debe asegurarse de que la columna de destino no esté vacía. El nombre de columna de destino no puede ser un duplicado de otra columna de destino. El nombre de columna de destino no puede tener un nombre duplicado como otra columna de destino. La longitud de la columna de destino no debe superar los 128 bytes. El límite de 128 bytes es un límite de base de datos.
-
Si la opción fila de cabecera de columna no está seleccionada, se utilizan nombres genéricos como COLUMN_1, COLUMN_2, etc. Puede cambiar el nombre de una columna de destino sustituyendo el nombre proporcionado por uno nuevo.
Nota
Si enlaza varios archivos de una carpeta en un único trabajo de enlace de datos, solo se mostrará el primer archivo en la sección Asignación. Sin embargo, siempre que los nombres de columna y los tipos de dato coincidan, los datos de todos los archivos de origen se enlazarán.
-
-
Tipo de datos: muestra el tipo de datos que se va a utilizar para los datos de esa columna. El contenido cambia en función de si la opción Obtener de cabecera de archivo está seleccionada.
-
Si la opción fila de cabecera de columna está seleccionada, Tipo de datos muestra los tipos de datos de las columnas en el archivo de origen. Si desea cambiar el tipo de datos para el destino, haga clic en el nombre y seleccione otro de la lista.
-
Si la opción fila de cabecera de columna no está seleccionada, Tipo de datos muestra todos los tipos de datos disponibles. Seleccione en la lista el tipo de dato que se va a utilizar para la columna de destino.
-
-
Longitud/precisión (opcional): para las columnas en las que el Tipo de datos es NÚMERO, introduzca la longitud/precisión de los números de la columna. La precisión es el número de dígitos significativos en un número. La exactitud puede oscilar entre el 1 y el 38.
Para las columnas en las que el tipo de dato es VARCHAR2, el valor Automático del campo Longitud/precisión activa la función Tamaño automático.
Con la función Ajustar Ancho de Columna de Tamaño Automático, puede cambiar automáticamente un tamaño de cualquier columna para ajustar el valor más grande de ésta. Seleccione Automático en los valores desplegables Longitud/precisión o seleccione un valor de la lista desplegable.
-
Escala (opcional): para las columnas en las que el Tipo de datos es NÚMERO, introduzca la escala para los números de la columna. La escala es el número de dígitos a la derecha (positivo) o a la izquierda (negativo) de la coma decimal. La escalabilidad puede variar entre -84 y 127.
-
Formato: si el tipo de dato de la columna Tipo de dato es DATE o uno de los tipos TIMESTAMP, seleccione un formato para ese tipo en la lista desplegable Formato.
Separador Preview
El menú Vista previa de carga del separador Vista previa muestra los datos de origen en formato tabular. La pantalla refleja la configuración que ha seleccionado en la sección Propiedades. El menú Archivo muestra los datos de origen con los nombres de columna.
Si ha arrastrado una carpeta que contiene varios archivos al carro de enlaces de datos y, a continuación, ha hecho clic en Configuración para esa tarjeta, el panel Vista previa incluye una lista desplegable Objeto de vista previa (archivo) en la parte superior del panel que muestra todos los archivos de la carpeta. Seleccione el archivo de origen que desea previsualizar de esa lista.
Separador Tabla
El separador Tabla muestra el aspecto que se espera que tenga la tabla de destino después de enlazar los datos.
Separador SQL
El separador SQL muestra los comandos SQL que se ejecutarán para completar este trabajo de enlace de datos.
Puede ver el código SQL incluso antes de crear la tabla.
Botón Close (Cerrar): Guardar y cerrar el panel
Después de introducir todos los detalles del trabajo de enlace de datos, haga clic en Cerrar en la parte inferior de la página. De esta forma, se guardan los detalles introducidos y se vuelve al panel Enlazar datos de Cloud Storage.
Tema principal: Enlace a objetos en Cloud Storage
Ejecutar el trabajo de enlace de datos
Una vez que haya agregado orígenes de datos al carro de enlace de datos e introducido detalles sobre el trabajo de enlace de datos, puede ejecutar el trabajo.
Para ejecutar el trabajo:
- Si aún no lo ha hecho, haga clic en el botón Cerrar del panel Enlazar datos de almacenamiento en la nube para guardar la configuración y cerrar el panel. Si alguna de las configuraciones no es válida, aparece un mensaje de error que informa el problema. Para solucionar el problema, haga clic en Cerrar.
-
Haga clic en
Iniciar en la barra de menús del carro de enlace de datos. Para parar el trabajo de enlace de datos, haga clic en
Parar.
Cuando finaliza el trabajo de enlace de datos, la página Panel de control de carga de datos muestra los resultados del trabajo en la sección Cargas de tablas y vistas.
Una vez que se inicia el trabajo de enlace de datos, puede ver el progreso del trabajo en el panel de control Carga de datos.
Tema principal: Enlace a objetos en Cloud Storage
Ver detalles sobre el trabajo de enlace de datos después de su ejecución
Puede ver el progreso del trabajo en el panel de control Carga de datos.
Cuando finaliza el trabajo de carga de datos, la página del panel de control Carga de datos muestra los resultados del trabajo. En la parte superior de la cabecera de la carga de tabla, puede ver el nombre de la tabla junto con el total de columnas presentes en la tabla.
Haga clic en Informe de trabajo para ver el número total de filas procesadas correctamente y el recuento de filas rechazadas. También puede ver la hora de inicio. El panel SQL del informe de trabajo muestra el código SQL equivalente del trabajo.
Para ver información sobre un elemento del trabajo, haga clic en el icono Acciones de la carga de tabla.
Para ver un log de la operación de carga, haga clic en el icono Registro. Puede guardar el log, borrarlo o refrescarlo. Haga clic en Aceptar para cerrar el log.
Tema principal: Enlace a objetos en Cloud Storage
Visualización de la tabla resultante del trabajo de enlace de datos
Después de ejecutar un trabajo de enlace de datos, puede ver la tabla creada por el trabajo de enlace de datos en el panel de control Carga de datos.
Corrija el trabajo de carga de datos. Después del trabajo de carga de datos, es posible que vea errores que desea corregir o, tras la inspección, se dé cuenta de que desea asignar un nombre diferente a una columna. En estos casos, haga clic en la opción Recargar de la carga de tabla seleccionada para volver a cargar las tarjetas del carro reciente y editarlas como lo hizo antes del primer intento. El icono Volver a cargar vuelve a cargar los datos de origen con las correcciones sugeridas por la herramienta. Haga clic en el icono Acciones de la cabecera de tabla, haga clic en Tabla y seleccione Editar para realizar cualquier cambio en el trabajo de carga de datos (es decir, cambiar un nombre de columna).
Tema principal: Enlace a objetos en Cloud Storage