Carga de datos

Puede cargar datos desde archivos en su dispositivo local, desde bases de datos remotas o desde cubos de almacenamiento en la nube desde directorios y proveedores de recursos compartidos. Los formatos de archivo que se pueden cargar son CSV, XLS, XLSX, TSV, TXT, XML, JSON, GEOJSON, AVRO, PARQUET, GZ, GZIP, ZIP, PDF, PNG, JPG, JPEG y TIFF.

La herramienta de carga de datos soporta la carga de archivos de origen con formato booleano. El booleano de tipo de dato tiene los valores de verdad TRUE y FALSE. Si no hay ninguna restricción NOT NULL, el tipo de dato booleano también soporta el valor verdadero UNKNOWN como valor nulo. Puede utilizar el tipo de dato booleano siempre que el tipo de dato aparezca en la sintaxis SQL de Oracle.

También soporta el tipo de dato VECTOR, que permite almacenar incrustaciones vectoriales directamente en las tablas de Oracle Database.

Uso de las capacidades del servicio OCI Language en Data Studio

Puedes utilizar las capacidades del servicio OCI Language, como el análisis de sentimientos, la extracción de frases clave y la detección de idiomas, para analizar datos sin experiencia en aprendizaje automático (ML) o inteligencia artificial (IA).

Por ejemplo, puede utilizarlo para comentarios sobre un producto. Un fabricante de teléfonos ha lanzado un nuevo modelo de teléfono y quieren saber cuál es el sentimiento del cliente en su producto. Si un gran porcentaje de sentimiento es negativo, podría indicar un fallo potencial con la cámara que no se detectó en el control de calidad (QC).

Visión general del análisis de sentimientos, la extracción de frases clave y la detección de idiomas

Actualmente, el análisis de sentimiento, la extracción de frases clave, la detección de idiomas y la traducción de texto están soportados para cargar datos de archivos locales y cargar datos del almacenamiento en la nube.

Análisis de sentimientos

Análisis de sentimiento analiza el texto para definir su sentimiento sobre un tema o producto. El análisis de sentimiento del servicio Language utiliza un procesamiento del lenguaje natural (NLP). La herramienta Data Studio utiliza el servicio Oracle Cloud Infrastructure (OCI) Language para analizar y comprender los datos de entrada. La herramienta Data Studio agrega dinámicamente nuevas columnas a la carga de datos que contiene la salida del servicio OCI Language. Puede detectar las opiniones de cualquier columna de los datos de origen. Por ejemplo, al buscar en una columna que contenga revisiones de una aplicación, suponga que desea una opinión general sobre la aplicación. La herramienta Data Studio realiza un análisis de sentimientos en los datos de entrada y crea una nueva columna de expresión definida en la tabla de destino que consta de la opinión.

Para obtener más información, consulte Análisis de sentimientos en OCI.

Extracción de frases clave

La extracción de frases clave identifica los conceptos principales de un texto. La extracción de palabras clave es el proceso automatizado de extracción de palabras con mayor relevancia y expresiones del texto introducido. Ayuda a resumir el contenido y reconoce los temas principales. Una nube de palabras se puede generar con frases clave para ayudar a visualizar conceptos clave en comentarios de texto o comentarios. Por ejemplo, una revisión de Película podría generar una nube de palabras basada en frases clave identificadas en sus comentarios y podría ver que la gente está comentando con mayor frecuencia sobre el personal de dirección, actuación y cinematografía.

Para obtener más información, consulte Extracción de frases clave en OCI.

Detección de idioma

Puede utilizar las capacidades del servicio de idioma de OCI, como la detección de idioma, para detectar el idioma del texto de entrada. Devuelve en qué lenguaje natural se encuentra el texto. Se puede utilizar para superar las barreras lingüísticas, mejorando así la comunicación con personas de otros países. Puede determinar el idioma del texto de entrada y traducir el contenido a diferentes idiomas. Para obtener más información, consulte Extracción de idiomas en OCI.

Traducción de texto

La traducción de texto traduce el texto de entrada a cualquiera de los idiomas de destino soportados por el servicio OCI Language. La herramienta Data Studio utiliza el servicio Oracle Cloud Infrastructure (OCI) Language para analizar y comprender los datos de entrada. La herramienta Data Studio agrega dinámicamente una nueva columna a la carga de datos que contiene la columna de origen de entrada traducida. Por ejemplo, cuando necesita saber qué dicen los clientes sobre su producto en el idioma del mercado local, el francés. La herramienta Data Studio realiza una traducción de idioma en los datos de entrada y crea una nueva columna de expresión definida en la tabla de destino que consta del idioma de origen traducido en la columna.

Antes de empezar:
  • Cargar datos de archivos locales o almacenamiento en la nube: cargue los datos que desea analizar en Oracle Autonomous Database desde archivos locales o almacenamiento en la nube. Asegúrese de que los datos se cargan en el carro de carga de datos sin errores. Puede ver y corregir errores de asignación desde el filtro rápido Errores en la carga de datos desde la ubicación del almacén en la nube. Después de cargar datos en la herramienta de carga de datos,
    • Haga clic en el icono Configuración del carro de trabajo de carga de datos para revisar la configuración.
    • En el panel Configuración del asistente Cargar datos desde ubicación de almacén en la nube, si se produce un error de asignación, la celda de cuadrícula de asignación se resaltará con rojo para indicar un valor no válido que se debe corregir.

    • Haga clic en el filtro rápido Errores; solo muestra las columnas con errores.

  • Las herramientas realizan análisis de sentimiento, extracción de frases clave y detección de idioma al especificar la configuración para el trabajo de carga de datos.

Parámetros para analizar datos

Al llamar a una expresión de agregación desde el separador Configuración, debe configurar el modelo mediante parámetros.

Tabla 3-3 Parámetros para el análisis de sentimientos, la extracción de fases clave y la detección de idiomas

Parámetro Descripción
Tipo de Expresión

Seleccione cualquiera de las siguientes operaciones que desee realizar en el texto de entrada: Análisis de sentimiento, Extracción de frase clave y Detección de idioma.

Columna de entrada

Seleccione la columna que desea analizar.

La lista desplegable de columnas de entrada solo contiene columnas que admiten Análisis de sentimiento, Extracción de frase clave y Detección de idioma.

Para el análisis de sentimiento, solo se mostrarán las columnas de destino VARCHAR2, NVARCHAR2, CLOB o NCLOB en la lista desplegable de entrada.

Columna de Destino
  • Introduzca el nombre de la columna de expresión recién creada definida en la tabla de destino.
  • En Análisis de sentimiento, esta columna muestra el sentimiento de la columna de entrada. Los diferentes tipos de sentimientos que identifica la herramienta son:
    • Positivo
    • Neutro
    • Mixto
    • Negative

      Si la herramienta no puede determinar el sentimiento de la columna de entrada, devuelve NULL en la columna de expresión.

  • Para la extracción de frases clave, esta columna muestra las frases clave de la columna de entrada que seleccione.
  • En Detección de idioma, esta columna muestra el idioma de la columna de entrada que seleccione.

Realizar análisis de sentimiento

Para determinar los sentimientos de los datos de entrada:

  1. Después de cargar datos en el carro de carga de datos desde archivos locales o almacenamiento en la nube, puede ver el archivo en el carro. Haga clic en la configuración icono.

  2. Al hacer clic en el icono Configuración, se abre un asistente para Cargar datos desde archivo local. En este ejemplo, hemos cargado datos de un archivo local.
  3. En el separador Configuración del asistente, haga clic en Agregar expresión en la sección Asignación.

    Se abre el cuadro de diálogo Agregar expresión.



  4. En el cuadro de diálogo Agregar expresión, especifique los siguientes campos:
    • Tipo de expresión: en la lista desplegable Tipo de expresión, seleccione Análisis de sentimiento.
    • Columna de entrada: seleccione la columna de la lista desplegable que desea analizar. Por ejemplo, CONTENT.
    • Columna de destino: introduzca el nombre de la columna de expresión recién creada. Por ejemplo, CONTENT_SENTIMENT.

      Consulte Parámetros para analizar datos para obtener más información.

  5. Haga clic en Aceptar. Verá una nueva fila agregada a la cuadrícula de asignación. Esta fila determina la columna de expresión de salida generada por el servicio OCI Language.

  6. Haga clic en Cerrar.
  7. Haga clic en Iniciar en el carro de menú Carga de datos para cargar datos de archivos locales. Verá un mensaje de confirmación en el que se le pregunta si desea iniciar la carga desde archivos locales.
  8. Haga clic en Ejecutar para confirmar.

Cuando finaliza el trabajo de carga de datos, la Cargas de Tabla y Vista de la página Carga de Datos muestra los detalles de la tabla de origen que se carga en la herramienta. Muestra el número de filas y columnas y cuándo se completó la carga.

Datos de salida generados a partir del análisis de sentimiento de OCI

Al analizar columnas mediante el modelo de servicio de idioma de OCI, Data Studio genera una nueva columna de expresión y guarda el resultado en la tabla actualizada.

Para localizar la columna de expresión generada, desde la pantalla de inicio de Database Actions, vaya a Carga de datos. Seleccione la tabla que carga en la sección Cargas de tabla y vista.

Haga clic en los tres puntos verticales junto al nombre de carga y, a continuación, haga clic en Tabla y seleccione Ver detalles.

Se abre el separador Vista previa de la carga de datos, que muestra el archivo de origen actualizado. Por ejemplo, aquí hay un conjunto de datos de salida del análisis de sentimientos de la aplicación Instagram. Aquí, CONTENT es la columna de destino y CONTENT_SENTIMENT es el análisis de sentimiento de la columna de entrada. Esta columna muestra uno de los siguientes valores, como positivo, neutro, mixto o negativo. Muestra Nulo cuando la herramienta no puede determinar el sentimiento.
A continuación se describe content-analysis.png
Descripción de la ilustración content-analysis.png

Realizar Extracción de Frases Clave

Para extraer información de frase clave de los datos de entrada:

  1. Después de cargar datos en el carro de carga de datos desde archivos locales o almacenamiento en la nube, puede ver el archivo en el carro. Haga clic en la configuración icono.

  2. Al hacer clic en el icono Configuración, se abre un asistente para Cargar datos desde archivo local. En este ejemplo, hemos cargado datos de un archivo local.
  3. En el separador Configuración del asistente, haga clic en Agregar expresión en la sección Asignación.

    Se abre el cuadro de diálogo Agregar expresión.



  4. En el cuadro de diálogo Add Expression, especifique los siguientes campos:
    • Tipo de expresión: en la lista desplegable Tipo de expresión, seleccione Extracción de frase clave.
    • Columna de entrada: seleccione la columna de la lista desplegable que desea analizar. Por ejemplo, CONTENT.
    • Columna de destino: introduzca el nombre de la columna de expresión recién creada. Por ejemplo, CONTENT_KEY_PHRASE_EXTRACTION.

    Consulte Parámetros para analizar datos para obtener más información.

  5. Haga clic en Aceptar. Verá que se ha agregado una nueva fila a la cuadrícula de asignación. Esta fila determina la columna de expresión de salida generada por el servicio OCI Language.

  6. Haga clic en Cerrar.
  7. Haga clic en Iniciar en el carro de menú Carga de datos para cargar datos de archivos locales. Verá un mensaje de confirmación en el que se le pregunta si desea iniciar la carga desde archivos locales.
  8. Haga clic en Ejecutar para confirmar.

Cuando finaliza el trabajo de carga de datos, la Cargas de Tabla y Vista de la página Carga de Datos muestra los detalles de la tabla de origen que se carga en la herramienta. Muestra el número de filas y columnas y cuándo se completó la carga.

Datos de salida generados a partir de la extracción de frases clave de OCI

Al analizar columnas mediante el modelo de servicio de idioma de OCI, Data Studio genera una nueva columna de expresión y guarda el resultado en la tabla actualizada.

Para localizar la columna de expresión generada, desde la pantalla de inicio de Database Actions, vaya a Carga de datos. Seleccione la tabla que carga en la sección Cargas de tabla y vista.

Haga clic en los tres puntos verticales junto al nombre de carga y, a continuación, haga clic en Tabla y seleccione Ver detalles.

Por ejemplo, aquí hay un conjunto de datos de salida del análisis de sentimientos de la aplicación Instagram. Aquí, CONTENT es la columna de destino y la columna CONTENT_KEY_PHRASE_EXTRACTION muestra las frases clave extraídas de la columna de entrada.
A continuación, se incluye la Descripción de key-output.png
Descripción de la clave de ilustración: output.png

Realizar detección de idioma

Data Studio soporta la detección de varios idiomas.

Para determinar el idioma del texto introducido:
  1. Después de cargar los datos en el carro de carga de datos desde el almacenamiento en la nube, puede ver el archivo en el carro. Haga clic en la Configuración icono.

  2. Al hacer clic en el icono de configuración, se abre el asistente Load Data from Cloud Store Location.
  3. En el separador Configuración del asistente, haga clic en Agregar expresión en la sección Asignación.

    Se abre el cuadro de diálogo Agregar expresión. Seleccione Expresiones AI.
    Descripción de add-expn-lang.bmp a continuación
    Descripción de la ilustración add-expn-lang.bmp

  4. En el cuadro de diálogo Add Expression, especifique los siguientes campos:
    • Tipo de expresión: en la lista desplegable Tipo de expresión, seleccione Detección de idioma.
    • Columna de entrada: seleccione la columna de la lista desplegable que desea analizar. En este caso, debemos detectar el idioma de la columna Review. Por ejemplo, REVISIÓN.
    • Columna de destino: introduzca el nombre de la columna de expresión recién creada. Por ejemplo, REVIEW_LANGUAGE_DETECTION.

    Consulte Parámetros para analizar datos para obtener más información.

  5. Haga clic en Aceptar. Verá que se ha agregado una nueva fila a la cuadrícula de asignación. Esta fila determina la columna de expresión de salida generada por el servicio OCI Language.

  6. Haga clic en Cerrar.
  7. Haga clic en Iniciar en el carro de menú Carga de datos para cargar datos de archivos locales. Verá un mensaje de confirmación en el que se le pregunta si desea iniciar la carga desde archivos locales.
  8. Haga clic en Ejecutar para confirmar.

Cuando finaliza el trabajo de carga de datos, la Cargas de Tabla y Vista de la página Carga de Datos muestra los detalles de la tabla de origen que se carga en la herramienta. Muestra el número de filas y columnas y cuándo se completó la carga.

Datos de salida generados a partir de la detección de idioma de OCI

Al analizar columnas mediante el modelo de servicio de idioma de OCI, Data Studio genera una nueva columna de expresión y guarda el resultado en la tabla actualizada.

Para localizar la columna de expresión generada, desde la pantalla de inicio de Database Actions, vaya a Carga de datos. Seleccione la tabla que carga en la sección Cargas de tabla y vista.

Haga clic en los tres puntos verticales junto al nombre de carga y, a continuación, haga clic en Tabla y seleccione Ver detalles.

Por ejemplo, aquí hay un conjunto de datos de salida de la detección de idioma de la columna Revisar. Aquí, REVIEW es la columna de destino y la columna REVIEW_LANGUAGE_DETECTION muestra el idioma detectado en la columna de entrada.
A continuación, se incluye la Descripción de output-language.bmp
Descripción de la ilustración output-language.bmp

Realizar traducción de texto

Data Studio soporta la traducción de varios idiomas soportada por OCI Language Service.

Para determinar el texto de entrada traducido:

  1. Después de cargar datos en el carro de carga de datos desde archivos locales, puede ver el archivo en el carro. Haga clic en la configuración icono.



  2. Al hacer clic en el icono Configuración se abre un asistente de carga de datos desde archivo local.
  3. En el separador Configuración del asistente, haga clic en Agregar expresión en la sección Asignación.



    Se abre el cuadro de diálogo Agregar expresión. Seleccione Expresiones AI.



  4. En el cuadro de diálogo Agregar expresión, especifique los siguientes campos:
    • Tipo de expresión: en la lista desplegable Tipo de expresión, seleccione Traducción de texto.
    • Columna de entrada: seleccione la columna de la lista desplegable que desea analizar. En este caso, debemos traducir el texto de la columna SOURCE_INPUT.
    • Columna de destino: introduzca el nombre de la columna de expresión recién creada. Por ejemplo, SOURCE_INPUT_TRANSLATION.
    • Idioma de destino: seleccione el idioma del texto que traduce la herramienta en la lista desplegable. Por ejemplo, Inglés.

    Consulte Parámetros para analizar datos para obtener más información.

  5. Haga clic en Aceptar. Verá que se ha agregado una nueva fila a la cuadrícula de asignación. Esta fila determina la columna de expresión de salida generada por el servicio OCI Language.



  6. Haga clic en Cerrar.
  7. Haga clic en Iniciar en el carro de menú Carga de datos para cargar datos de archivos locales. Verá un mensaje de confirmación en el que se le pregunta si desea iniciar la carga desde archivos locales.
  8. Haga clic en Ejecutar para confirmar.

Cuando finaliza el trabajo de carga de datos, la Cargas de Tabla y Vista de la página Carga de Datos muestra los detalles de la tabla de origen que se carga en la herramienta. Muestra el número de filas y columnas y cuándo se completó la carga.

Datos de salida generados a partir de la traducción de texto de OCI

Al analizar columnas mediante el modelo de servicio de idioma de OCI, Data Studio genera una nueva columna de expresión y guarda el resultado en la tabla actualizada.

Para localizar la columna de expresión generada, desde la pantalla de inicio de Database Actions, vaya a Carga de datos. Seleccione la tabla que carga en la sección Cargas de tabla y vista.

Haga clic en los tres puntos verticales junto al nombre de carga y, a continuación, haga clic en Tabla y seleccione Ver detalles.



Uso de OCI Document Understanding para extraer tablas de imágenes

Puede utilizar las capacidades de Oracle Cloud Infrastructure (OCI) Document Understanding, como la extracción de tablas, para detectar tablas a partir de los datos que carga.

Los formatos de archivo admitidos para usar esta función son los formatos PDF, JPEG, JPG, PNG y Tag Image File Format (TIFF).

Por ejemplo, si un documento PDF consta de todos los detalles del empleado, incluida su fecha de contratación y salario, la comprensión del documento identificará la tabla y extraerá la estructura de la tabla. Extraerá el contenido de la tabla mientras mantiene la relación de fila y columna de las celdas.

Visión General de Extracción de Tablas

La herramienta Load Data soporta Table Extraction para cargar datos de archivos locales y cargar datos de almacenamiento en la nube.

Extracción de tabla

El servicio OCI Document Understanding permite a los clientes descubrir información en documentos no estructurados basados en modelos de aprendizaje profundo. Permite extraer texto, tablas e identificar tipos de documentos, entre otras grandes capacidades. La extracción de tablas identifica todas las tablas de un documento y extrae el contenido en formato tabular manteniendo la relación fila/columna.

Nota

Este servicio solo está disponible para los datos de origen en inglés.

Para obtener más información, consulte Extracción de tablas.

Realizar extracción de tabla desde imagen

Vamos a realizar la extracción de tablas con un PDF de ejemplo.

Puede ver una tabla en el PDF a continuación.



Para extraer una tabla del PDF ubicado en la ubicación de almacenamiento en la nube:
  1. Cargue el archivo PDF en el carro de carga de datos desde el almacenamiento en la nube. Puede arrastrar y soltar el archivo desde el navegador hasta el carro.



  2. Haga clic en Iniciar para cargar los datos. Recibirá una notificación que confirma si desea comenzar a cargar los datos. Haga clic en Ejecutar para continuar.



  3. Una vez finalizada la carga, puede ver el archivo cargado en Tabla y Ver cargas en el panel de control Carga de datos.



  4. Extraiga la tabla del PDF que ha cargado en la base de datos autónoma:
    • Haga clic en Database Actions en la ruta de navegación.
    • Seleccione Desarrollo y, a continuación, haga clic en SQL.
    • Seleccione Tablas, en el navegador izquierdo, en la lista desplegable de objetos. En la lista de tablas disponibles, arrastre y suelte la tabla EMP_ALL en la hoja de trabajo.



      Se muestra un cuadro de diálogo que ofrece los tipos de inserciones disponibles.



      Haga clic en Seleccionar y, a continuación, Aplicar.

    • Haga clic en Ejecutar (icono de flecha en la parte superior de la hoja de trabajo). La herramienta muestra la tabla extraída en la ficha Resultados de la consulta.



Utilizar GeoJSON en Data Load

Un objeto GeoJSON contiene información sobre la geometría específica (p. ej., punto, línea, polígono, etc.) junto con metadatos opcionales (p. ej., ID, etc.).

La extensión de un archivo GeoJSON es *.geojson. Puede cargar datos GeoJSON en la instancia de Autonomous Database mediante la carga de datos en Data Studio. Si la tabla contiene datos GeoJSON, los datos se cargan en una columna que proyecta datos GeoJSON del juego de documentos del tipo de dato SQL SDO_GEOMETRY.

Cargar una tabla con datos de GeoJSON

Al cargar una tabla en Data Studio con datos GeoJSON y revisar su configuración, verá que crea la tabla Brazil_Geo, que tiene una columna geometry de datos GeoJSON.



Después de cargar BRAZIL_GEO, verá que la herramienta carga el objeto GeoJSON en una nueva columna geometry con el tipo de dato SDO_GEOMETRY.
A continuación, se incluye la Descripción de edittable-geo.png
Descripción de la ilustración edittable-geo.png

También puede ver lo mismo en el separador Definición de datos al Ver detalles de la carga de tabla después de ejecutarla.
A continuación se ofrece una descripción de datadefinition-geo.png
Descripción de la ilustración datadefinition-geo.png

Agregar expresión espacial para columnas GeoJSON

Oracle Spatial está diseñado para hacer que la gestión de datos espaciales sea más fácil y natural para los usuarios de aplicaciones habilitadas para la ubicación y aplicaciones de sistemas de información geográfica (GIS).

Una vez que los datos espaciales se almacenan en una base de datos Oracle, se pueden manipular, recuperar y relacionar fácilmente con todos los demás datos almacenados en la base de datos.

El modelo de datos espaciales de Oracle Spatial es una estructura jerárquica que consta de elementos, geometrías y capas. Las capas se componen de geometrías, que a su vez se componen de elementos.

La tolerancia se utiliza para asociar un nivel de precisión con los datos espaciales. La tolerancia refleja la distancia entre dos puntos permitidos para que aún se considere el mismo (por ejemplo, para incluir errores de redondeo). El valor de tolerancia debe ser un número positivo mayor que cero. Consulte Tolerancia en datos espaciales para obtener más información.

Parámetros para análisis de datos espaciales

Al llamar a una agregación de expresión y seleccionar expresiones espaciales en el asistente agregación de expresión, debe configurar el modelo mediante parámetros.

Tabla 3-4 Parámetros para el análisis de datos espaciales

Parámetro Descripción
Tipo de Expresión
Seleccione cualquiera de los siguientes atributos espaciales, como Longitud o Área:
  • Longitud: al seleccionar este atributo se devuelve y se almacena el perímetro de un polígono bidimensional en la tabla de asignación con una columna de destino de tipo GEOMETRY_LENGTH.
  • Área: al seleccionar este atributo se devuelve y se almacena el área de un polígono bidimensional en la tabla de asignación con una columna de destino de tipo GEOMETRY_AREA.
Columna de entrada

Seleccione la columna que desea analizar para datos espaciales:

Por defecto, verá una columna GEOMETRY en Origen asignada al valor de columna SDO_GEOMETRY. Esto también significa que la tabla está activada espacialmente.

Columna de Destino
Se trata de la columna de expresión recién creada definida en la tabla de destino que almacena el resultado de la expresión espacial y depende del valor de tipo de expresión que seleccione:
  • GEOMETRY_LENGTH: si selecciona Longitud como tipo de expresión, puede ver la columna de destino del tipo GEOMETRY_LENGTH, que muestra el valor de longitud de la geometría.
  • GEOMETRY_AREA: si selecciona Área como tipo de expresión, puede ver la columna de destino del tipo GEOMETRY_AREA, que muestra el valor de área de la geometría.

Realizar análisis espaciales

Puede cargar datos espaciales mediante la herramienta de carga de datos desde archivos locales o almacenamiento en la nube.

Para realizar un análisis espacial en los datos GeoJSON:
  1. Después de cargar datos en el carro de carga de datos desde archivos locales o almacenamiento en la nube, puede ver el archivo en el carro. Haga clic en la Configuración icono.

  2. En el separador Configuración del asistente, seleccione Rectificar geometría para corregir geometrías no válidas. Este icono corrige los errores más comunes, como puntos duplicados, errores de orientación de polígonos, errores de construcción de polígonos, etc. Si detecta algún error no corregible, falla con una excepción ORA-13199: the given geometry cannot be rectified.

    Nota

    No puede corregir las geometrías que tengan una orientación incorrecta con la. Icono Rectificar geometría.
  3. Especifique el valor de Tolerancia. En el ejemplo anterior, especificamos 0,005 como tolerancia, es decir, 5 mm.
  4. Haga clic en Agregar expresión en la sección Asignación y seleccione Expresiones espaciales.

    En el cuadro de diálogo Agregar expresión, especifique los siguientes campos:
    • Tipo de expresión: en la lista desplegable Tipo de expresión, seleccione Área para mostrar el área de un polígono bidimensional. También puede seleccionar Longitud para mostrar el perímetro de un polígono bidimensional.
    • Columna de entrada: verá una columna GEOMETRY por defecto. Esta columna de origen almacena el área de la geometría. En caso de que seleccione Longitud como tipo de expresión, esta columna de origen almacena la longitud de la geometría.
    • Columna de destino: especifica el nombre de la columna de expresión especial recién creada. Por ejemplo, GEOMETRY_AREA para el parámetro de expresión de tipo Área y GEOMETRY_LENGTH para el parámetro de expresión de tipo Longitud.
    En la sección Opciones avanzadas, especifique los siguientes valores de campo:
    • Tolerancia: introduzca el valor de tolerancia. Por ejemplo, 0.005.
    • Unidad: seleccione una unidad de medida de la tolerancia en la lista desplegable. Por ejemplo, Square meter.
    Nota

    Si el archivo que carga no contiene datos espaciales, verá el siguiente error en el asistente Agregar expresión "No input columns have the SDO_GEOMETRY data type for the currently selected expression type of Area".

    Consulte Parámetros para el análisis de datos espaciales para obtener más información.

  5. Haga clic en Aceptar. Verá una nueva fila agregada a la cuadrícula de asignación. Esta fila determina la columna de expresión espacial de salida generada por el servicio OCI Language. En este ejemplo, puede ver que se creará un nuevo GEOMETRY_AREA en la tabla de destino después de cargar la tabla.

Para obtener más información sobre Oracle Spatial, consulte la Guía del desarrollador de Oracle Spatial.

Cuando finaliza el trabajo de carga de datos, la Cargas de Tabla y Vista de la página Carga de Datos muestra los detalles de la tabla de origen que se carga en la herramienta. Muestra el número de filas y columnas y cuándo se completó la carga.

Datos de salida generados a partir de análisis espacial

Al analizar columnas mediante expresiones espaciales, Data Studio genera una nueva columna de expresión y guarda el resultado en la tabla actualizada.

Para localizar la columna de expresión generada, desde la pantalla de inicio de Database Actions, vaya a Carga de datos. Seleccione la tabla que carga en la sección Cargas de tabla y vista.

Haga clic en los tres puntos verticales junto al nombre de carga y, a continuación, haga clic en Tabla y seleccione Ver detalles.

Se abre el separador Vista previa de la carga de datos, que muestra el archivo de origen actualizado. Por ejemplo, aquí hay un juego de datos de salida del análisis espacial del archivo COUNTRIESGEO.GeoJSON. Aquí, GEOMETRY_AREA es el análisis espacial de la columna de entrada. Esta columna muestra el área de los polígonos bidimensionales.
A continuación, se incluye la Descripción de spatial-output.bmp
Descripción de la ilustración spatial-output.bmp

Carga de tablas Apache Iceberg

Data Studio soporta la carga y el enlace de tablas Iceberg desde el almacén de objetos.

La herramienta puede cargar varias versiones del mismo archivo.

  1. Seleccione la ubicación de la tienda en la nube que tiene tablas de iceberg definidas. En este ejemplo, seleccionaremos el ICEBERGBUCKET almacenado en OCI.



    Puede detectar los archivos Iceberg con el símbolo Iceberg
    A continuación se describe symbol.png
    Descripción de la ilustración symbol.png

    además de su nombre.

  2. Arrastre la carpeta al navegador de archivos de la izquierda y suéltela en el carro de la derecha. La carpeta también consta del archivo JSON de metadatos que realiza un seguimiento de las instantáneas de tabla, el esquema de partición y la información de esquema.

    Al agregar la carpeta al carro, se muestra una advertencia sobre el número de archivos que constan de una petición de datos de información de identificación personal (PII).



    Nota

    : si carga varios archivos en lugar de una carpeta, la herramienta le pregunta si desea cargar todos los objetos de los varios archivos de origen en una única tabla de destino. Haga clic en Aceptar para continuar o en Escape para cancelar.
  3. Haga clic en Iniciar en la barra de menús del carro del enlace de datos. Verá una notificación que indica si desea iniciar la carga desde el almacén en la nube. Seleccione Ejecutar para continuar.



  4. Verá el progreso de carga en Cargas de tabla y de vista. Después de cargar, verá los iconos Informe y Volver a cargar en la carga de la tabla.



  5. Consulte las tablas de Iceberg cargadas en la instancia de Autonomous Database:
    • Haga clic en Database Actions en la ruta de navegación.
    • Seleccione Desarrollo y, a continuación, haga clic en SQL.
    • Seleccione Tablas, en el navegador izquierdo, en la lista desplegable de objetos. En la lista de vistas disponibles, arrastre y suelte la tabla CALL_CENTER_PARQUET en la hoja de trabajo.



    • Se muestra un cuadro de diálogo que ofrece los tipos de inserciones disponibles.



      Haga clic en Seleccionar y, a continuación, Aplicar.

    • Haga clic en Ejecutar (icono de flecha en la parte superior de la hoja de trabajo). La herramienta muestra los datos del iceberg en Resultados de consulta.



Carga de datos desde el sistema de archivos

Puede cargar archivos de directorios del sistema de archivos en su instancia de Autonomous Database.

Puede definir filtros en los datos de una tabla para cargar solo los datos especificados. Por ejemplo, para limitar los archivos solo a los archivos CSV, introduzca *.CSV en el filtro de extensión de archivo.

Configure y ejecute un trabajo de carga de datos desde la página Load Cloud Object. Para abrir esa página:
  1. En el separador Data Studio y seleccione Carga de datos. Verá el panel de control de carga de datos.
  2. Haga clic en Cargar datos y seleccione la opción Sistema de archivos.

En la parte superior de la página, debe seleccionar el directorio desde el que necesita cargar los archivos. En el lado izquierdo de la página hay un panel del navegador, donde puede elegir los archivos del directorio que contienen los datos. A la derecha de la página se encuentra el carro de carga de datos, donde almacena en área temporal los archivos y carpetas para el trabajo de carga de datos. Puede definir opciones para el trabajo de carga de datos antes de ejecutarlo. Autonomous Database incluye recursos compartidos predefinidos de CPU/E/S asignados a diferentes grupos de consumidores. Puede definir el grupo de consumidores en bajo, medio o alto al ejecutar un trabajo de carga de datos en función de la carga de trabajo. Para cargar archivos de un directorio en la base de datos, haga lo siguiente:

  1. Prepare el trabajo de carga de datos: consulte la sección Preparación del trabajo de carga de datos para obtener más información.
  2. Agregar Archivos o Carpetas para el Trabajo de Carga de Datos: Consulte la sección Agregar Archivos o Carpetas para el Trabajo de Carga de Datos para obtener más información.
  3. Introduzca detalles para el trabajo de carga de datos: consulte Introducción de detalles para el trabajo de carga de datos para obtener más detalles.
  4. Ejecute el trabajo de carga de datos: consulte la sección Ejecutar el trabajo de carga de datos para obtener más información.
  5. Ver detalles sobre el trabajo de carga de datos después de su ejecución: consulte la sección Ver detalles sobre el trabajo de carga de datos después de su ejecución para obtener más información.
  6. Consulte la tabla resultante del trabajo de carga de datos: consulte la sección Visualización de la tabla resultante del trabajo de carga de datos para obtener más información.

Creación de directorios en Database Actions

En la instancia de Autonomous Database, hay un data_pump_dir preconfigurado donde puede almacenar archivos. También puede crear directorios, borrar directorios y conectar sistemas de archivos de red.

Por ejemplo, puede utilizar el comando CREATE DIRECTORY para crear directorios adicionales. Utilice el comando DROP DIRECTORY de la base de datos para borrar directorios y utilice DBMS_CLOUD.LIST_FILES para mostrar el contenido de un directorio.

Creación de un directorio

Para agregar un directorio, debe tener el privilegio de sistema CREATE ANY DIRECTORY. Al usuario ADMIN se le otorga el privilegio de sistema CREATE ANY DIRECTORY. El usuario ADMIN puede otorgar privilegios para el sistema CREATE ANY DIRECTORY a otros usuarios.

Consulte CREATE DIRECTORY para obtener más información.

Nota

  • CREATE DIRECTORY crea el objeto del directorio de la base de Datos en la base de Datos y también crea el directorio de sistemas de archivos. Por ejemplo, la ruta de acceso al directorio podría ser:
    /u03/dbfs/7C149E35BB1000A45FD/data/stage
  • Puede crear un directorio en el sistema de archivos raíz para ver todos los archivos con los siguientes comandos:

    CREATE OR REPLACE DIRECTORY ROOT_DIR AS '';

    Después de crear el directorio ROOT_DIR, utilice el siguiente comando para mostrar todos los archivos:

    SELECT * FROM DBMS_CLOUD.list_files('ROOT_DIR');
  • Para ejecutar DBMS_CLOUD.LIST_FILES con un usuario que no sea ADMIN, debe otorgar privilegios de lectura en el directorio a ese usuario.

Vamos a demostrar cómo crear un directorio y acceder a él desde Data Studio:

  • Crear un directorio en Database Actions:

    Conéctese a la instancia de Database Actions y seleccione la tarjeta SQL en Desarrollo. Puede ver la hoja de trabajo de SQL. A continuación, cree un directorio y adjunte el nombre del sistema de archivos que desee al directorio que cree. En el siguiente ejemplo, FSS_DIR es el nombre del directorio.

    A continuación se describe create-directory.png
    Descripción de la ilustración create-directory.png

    Ejecute el comando anterior. El comando anterior proporciona la siguiente salida:

    El procedimiento PL/SQL se ha completado correctamente.

  • Adjuntar el sistema de archivos
    Conecte el sistema de archivos con el nombre que desee al directorio FSS_DIR mediante el procedimiento DBMS_CLOUD_ADMIN.ATTACH_FILE_SYSTEM.
    
    BEGIN
      DBMS_CLOUD_ADMIN.ATTACH_FILE_SYSTEM(
        file_system_name => '********',
        file_system_location => '*******.sub1********1.********.oraclevcn.com:/********',
        directory_name => 'FSS_DIR',
        description => 'attach OCI file system'
      );
    END;
    /
    
    

    Ejecute el comando anterior para ver la siguiente salida:

    PL/SQL procedure successfully completed.

  • Para ver el sistema de archivos adjunto, ejecute el siguiente comando:

    SELECT file_system_name, file_system_location, directory_path FROM dba_cloud_file_systems;

    Verá el nombre del sistema de archivos, la ubicación del sistema de archivos y la ruta del directorio.

  • Puede ver el nuevo directorio junto con los archivos asociados a él navegando hasta Load Cloud Object en el menú Data Load de la herramienta Data Studio. Haga clic en la lista desplegable Seleccionar ubicación de almacén en la nube.A continuación se describe new-dir.png
    Descripción de la ilustración new-dir.png

Puede ver el directorio recién creado FSS_DIR. Puede cargar datos de los directorios del sistema de archivos en la base de datos autónoma mediante la herramienta Data Load. Consulte Loading Data from File System.

Carga de datos desde origen de IA

Puede utilizar las herramientas de Data Studio para cargar datos desde el origen de AI.

En el panel de control Carga de datos, haga clic en la tarjeta Cargar datos y seleccione Origen de AI.



Debe realizar un requisito previo para configurar su perfil de IA antes de usar esta función. Consulte Configuración del paquete DBMS_CLOUD_AI para obtener más información sobre la configuración de esta función.

Para definir un perfil de AI, debe tener:
  • Una cuenta OpenAI, una cuenta Cohere o un servicio OpenAI de Azure
  • Acceso al paquete DBMS_CLOUD_AI.

Siga los pasos de la sección Usar DBMS_CLOUD_AI para configurar perfiles de IA para crear y configurar su perfil de IA y utilizar esta función.

Carga de datos desde el recurso compartido

Puede seleccionar tablas de un recurso compartido. Debe suscribirse y acceder al recurso compartido de datos proporcionado.

Para cargar tablas desde un recurso compartido, haga clic en Cargar datos en el panel de control de carga de datos. Haga clic en Compartir en la página Cargar datos. Haga clic en + Suscribirse a un proveedor de recursos compartidos para suscribirse a un proveedor de recursos compartidos.

Suscribirse al proveedor de uso compartido de datos

Para suscribirse, debe utilizar la información incluida en el perfil JSON cargado que recibió del proveedor de recursos compartidos.
  1. En Subscribe to Data Share Provider, introduzca el Nombre del Proveedor.A continuación se muestra la descripción de subscribe_1.png
    Descripción de la ilustración subscribe_1.png
  2. Seleccione Add New Provider JSON y haga clic en el JSON Delta Share Profile para arrastrar y soltar el perfil JSON.
  3. Haga clic en Siguiente para avanzar al separador Agregar recursos compartidos.
  4. Seleccione el nivel de acceso de red que desea permitir desde la base de datos al host con el punto final de REST de recurso compartido y haga clic en Ejecutar. En este ejemplo, se ha seleccionado Permitir acceso solo al host.Descripción de network_acl_script.png a continuación
    Descripción de la ilustración network_acl_script.png
  5. Para registrar los recursos compartidos que tiene disponibles, mueva los recursos compartidos de Recursos compartidos disponibles a Recursos compartidos seleccionados y haga clic en Suscribirse.

    En la siguiente captura de pantalla se muestra el recurso compartido REVISIONES movido de Recursos compartidos disponibles a Recursos compartidos seleccionados antes de hacer clic en Suscribirse.

    A continuación se muestra la descripción de subscribe_2.png
    Descripción de la ilustración subscribe_2.png
  6. Creación de tablas externas derivadas de tablas seleccionadas del recurso compartido de datos.
    1. Arrastre y suelte tablas del recurso compartido seleccionado. Si lo desea, puede hacer clic en Configuración para ver los detalles de la tabla.

      En este ejemplo, la única tabla seleccionada es HOTEL_REVIEWS.

      Descripción de sel_tbls.png a continuación
      Descripción de la ilustración sel_tbls.png
    2. Opcionalmente, puede cambiar el nombre de la tabla y hacer clic en Cerrar.

      En este ejemplo, el nombre se cambia de HOTEL_REVIEWS a HOTEL_REVIEWS_SHARE.

      Descripción de name_change.png a continuación
      Descripción de la ilustración name_change.png
    3. Cree la tabla externa haciendo clic en Iniciar, en la página Seleccionar recurso compartido y, a continuación, en Ejecutar en el cuadro de diálogo Ejecutar trabajo de carga de datos. Descripción de start_run.png a continuación
      Descripción de la ilustración start_run.png
    4. Cuando se crean las tablas externas, se muestra el mensaje Complete.Descripción de xt_complete.png a continuación
      Descripción de la ilustración xt_complete.png
    5. Haga clic en el nombre de la tabla externa para ver los detalles de la tabla.Descripción de xt_details.png a continuación
      Descripción de la ilustración xt_details.png
  7. Visualice las tablas creadas desde Database Actions.
    1. Haga clic en Database Actions, en la ruta de navegación, para volver a la pantalla de inicio de Database Actions.
    2. Haga clic en el mosaico SQL.
    3. Seleccione la tabla externa, arrástrela y suéltela en la hoja de trabajo.

      Aparece la sentencia SQL Select de la tabla. Esta sentencia SQL se puede ejecutar para consumir los datos compartidos.

      Descripción de xt_sql.png a continuación
      Descripción de la ilustración xt_sql.png
  8. Arrastrar y soltar tablas del recurso compartido seleccionado

Crear fuente activa a partir de carga de datos

La herramienta de carga de datos carga los datos de las carpetas en los almacenes de objetos en la nube y le permite programar cargas de datos repetidas en tiempo real. Se trata de la creación de fuentes activas a partir de un trabajo de carga de datos.

Una vez finalizada la carga de datos, puede crear una fuente activa a partir de un artículo del carro que haya cargado una carpeta del almacén de objetos mediante las opciones Crear tabla o Borrar tabla y Crear nueva tabla.

Para crear una fuente activa a partir de Data Load:
  1. Haga clic en Selector para mostrar el menú de navegación. En Data Studio, seleccione Data Load.
  2. Seleccione el mosaico Cargar datos para cargar datos de varios orígenes, como archivos locales, bases de datos, almacenamiento en la nube, directorios y recursos compartidos.
  3. Haga clic en Almacenes en la nube para cargar objetos desde URL o enlaces del almacén en la nube.
  4. Seleccione la ubicación de la tienda en la nube en la lista desplegable. Si no puede ver la ubicación del almacén en la nube, seleccione Crear ubicación de almacén en la nube para crear una nueva ubicación del almacén en la nube. Siga los pasos que se describen en Crear credenciales nativas de Oracle Cloud Infrastructure si no tiene una ubicación en la nube disponible.
  5. Después de seleccionar la ubicación del almacén en la nube, puede ver la lista de carpetas y archivos presentes en el almacenamiento en la nube. Agregue archivos del almacén en la nube al carro de carga de datos, donde puede editar los detalles del trabajo de carga.
    Nota

    Esta herramienta no soporta la creación de una fuente dinámica a partir de un elemento de carro cargado formado por un único archivo en formato CSV, XLS, XLSX, TSV, TXT, XML, JSON y AVRO, o bien por una carpeta que contenga un archivo en formato XLSX.
  6. Para agregar las carpetas, arrastre una carpeta desde el navegador de archivos de la izquierda y suéltela en el carro de la derecha. Al agregar la carpeta al carro, se muestra una petición de datos que le pregunta si desea cargar todos los objetos de los varios archivos de origen en una única tabla de destino. Haga clic en para continuar, o enNo para cancelar. Puede agregar varias carpetas al carro, los datos representados por cada tarjeta se cargarán en una tabla independiente, pero todos los elementos del carro se procesarán como parte del mismo trabajo de carga de datos.
  7. Seleccione Configuración (icono de lápiz) en el carro de carga de datos para introducir los detalles sobre el trabajo de carga de datos.
  8. En el separador Configuración del separador Cargar datos desde la ubicación del almacén en la nube, puede seleccionar Crear tabla o Borrar tabla y crear nueva tabla en la lista desplegable Opción.
    Nota

    La herramienta de fuente activa solo funciona con el trabajo de carga de datos si crea una tabla e inserta los datos en una nueva tabla o borra la tabla existente e inserta los datos en una nueva tabla.
  9. Introduzca los demás detalles del trabajo de carga de datos. Para obtener más información sobre la introducción de detalles, consulte el tema Introducción de detalles para el trabajo de carga de datos.
  10. Una vez que haya agregado orígenes de datos al carro de carga de datos y haya introducido detalles sobre el trabajo de carga de datos, seleccione Iniciar para ejecutar el trabajo.
  11. Después de ejecutar el trabajo de carga de datos, el carro de carga de datos muestra una marca de verificación verde

    que indica que el trabajo de carga de datos ha finalizado.
  12. Haga clic en Crear fuente de tabla activa en el carro de carga de datos para crear una fuente de tabla activa a partir del trabajo de carga de datos. Verá un mensaje correcto que indica que la creación de la fuente de tabla activa se ha realizado correctamente y si desea editar la fuente de la tabla activa. Haga clic en para continuar y en No para cancelar. Al seleccionar , se abre un asistente de edición de fuentes de tablas activas.
  13. En el asistente Editar fuente de tabla activa, puede ver la ubicación del almacén en la nube de la carpeta de origen y el filtro de objeto aplicado a los datos.

    Seleccione cualquier archivo cuyos datos desea obtener una vista previa en la lista desplegable Vista previa del separador Origen de datos: el campo muestra el número total de archivos presentes en la carpeta del almacén en la nube que ha cargado. Se muestra una vista previa de la información.



  14. Haga clic en Siguiente para avanzar al separador Configuración de tabla.

    Puede ver los detalles de propiedades y asignación del trabajo de carga de datos en el separador Configuración de tabla.
    Nota

    No puede seleccionar ni editar ninguno de los detalles de este separador.
  15. Haga clic en Siguiente para avanzar al separador Vista previa del asistente.

    Seleccione cualquier archivo de la lista desplegable Vista previa para ver el archivo. La vista previa de tabla muestra la vista previa del archivo seleccionado en la lista desplegable.



  16. Haga clic en Siguiente para ver el separador Configuración de fuente activa del asistente. En el separador Configuración de fuente activa, especifique los siguientes valores en el campo:

    • Activar para notificación: seleccione esta opción para que los datos nuevos o modificados del origen de datos se carguen en función de una notificación de Oracle Cloud Infrastructure. Al seleccionar esta opción, puede evitar retrasos que puedan producirse al iniciar el sondeo en un programa (es decir, si ha seleccionado la opción de fuente de tabla activa Programada).

      Al seleccionar la opción Activar para notificación, también debe configurar el cubo del almacén de objetos para que emita notificaciones

    • Activar para programación: seleccione esta opción para configurar un programa para la fuente de datos. En los campos de intervalo de tiempo, introduzca un número y seleccione un tipo de tiempo y los días en los que sondear el cubo para buscar archivos nuevos o modificados. Por ejemplo, para sondear cada dos horas los lunes, miércoles y viernes, introduzca 2, seleccione Horas y, a continuación, seleccione Lunes, Miércoles y Viernes en los campos adecuados. Puede seleccionar Todos los días, De lunes a viernes, De domingo a jueves o Personalizado en la lista desplegable Días de la semana. El campo Personalizado permite seleccionar Lunes,Martes, Miércoles, Jueves y Viernes.

    Seleccione una fecha de inicio y una de finalización. Si no selecciona una fecha de inicio, la fecha y la hora actuales se usarán como fecha de inicio. La fecha de finalización es opcional. Sin embargo, sin una fecha de finalización, el feed continuará sondeando.

    El resto de los campos que se muestran en el asistente, como Nombre de fuente de tabla activa, Nombre de tabla de destino y Grupo de consumidores, aparecen desactivados y desactivados para su selección o edición.

Haga clic en Guardar para guardar y crear una fuente de tabla activa a partir de un carro de carga de datos.