Tablas

Las tablas definen la estructura de los datos.

Puede cargar nuevos datos en las tablas o datos de referencia en una ubicación existente. Puede definir permisos de control de acceso detallados en las tablas mediante la creación de permisos de tabla.

Las tablas pueden ser externas o gestionadas.

Tablas externas

Una tabla externa define una estructura para los datos que se almacenan en una ubicación no gestionada por Oracle AI Data Platform Workbench. Al crear una tabla externa en AI Data Platform Workbench, el ciclo de vida de los metadatos lo gestiona AI Data Platform Workbench. Al suprimir una tabla externa, solo se suprime la definición de tabla. Los datos a los que hace referencia la tabla externa no se suprimen.

Asegúrese de que los usuarios tienen las siguientes políticas de IAM necesarias para crear tablas externas:

allow group <GroupName> to read buckets in compartment id <external-data-CompartmentId>
allow group <GroupName> to inspect objects in compartment id <external-data-CompartmentId>

Se necesitan políticas de IAM adicionales para las tablas externas. Para obtener más información, consulte Políticas de IAM para el área de trabajo de Oracle AI Data Platform.

Tablas gestionadas

Una tabla gestionada define una estructura para los datos que se almacenan en AI Data Platform y a la que solo pueden acceder los usuarios de AI Data Platform Workbench.

Al suprimir una tabla gestionada, se suprimen la definición de tabla y los datos de tabla.

Formatos de tabla soportados

Formato Descripción Uso
Valores separados por coma (CSV) Los datos se almacenan como un archivo de texto con un formato de archivo basado en filas especificado para estructurar los datos. Normalmente, la primera fila del archivo es una fila de cabecera que contiene nombres de columnas para los datos. Se utiliza para intercambiar datos tabulares entre sistemas. Cada fila del archivo es una fila de una tabla.
Notaciones de objetos de JavaScript (JSON) Los datos se almacenan en un formato estándar basado en texto para representar datos estructurados basados en la sintaxis de objeto JavaScript. JSON soporta listas de objetos o estructuras jerárquicas. Se utiliza en aplicaciones de flujo. JSON simplifica el almacenamiento de datos relacionados con relaciones complejas en un solo documento y evita la conversión de listas caóticas a un modelo de datos relacional. Tenga en cuenta que JSON no se puede dividir.
Avro Los datos se almacenan en un formato binario basado en filas mientras que el esquema se almacena en formato JSON para minimizar el tamaño del archivo y maximizar la eficiencia. Avro cuenta con un soporte fiable para la evolución del esquema mediante la gestión de campos agregados, faltantes y modificados. Esto permite que el software antiguo lea datos nuevos y que el nuevo software lea datos antiguos. También conocido como sistema de serialización de datos. Se utiliza para el almacenamiento de datos, ya que los archivos avro se pueden dividir y comprimir. El almacenamiento basado en filas serializado es ideal para transacciones de escritura intensa, como la inserción de datos en AI Data Platform. Avro también es una buena opción cuando la evolución del esquema es crítica durante las escrituras de alta velocidad.
Parquet Los datos se almacenan en un formato de datos en columnas y son altamente comprimibles y dividibles. Parquet está optimizado para el paradigma Write Once Read Many (WORM). Escribe lentamente, pero lee increíblemente rápido, especialmente cuando solo se accede a un subconjunto de columnas. Se utiliza para resolver problemas de Big Data a medida que los algoritmos de compresión funcionan mejor con el formato de datos en columnas. Puede almacenar Big Data en varios formatos, como imágenes, vídeos, documentos y tablas de datos estructurados. Parquet es una buena opción para cargas de trabajo pesadas al leer partes de datos. Por ejemplo, cuando el juego de datos tiene muchas columnas, pero solo desea acceder a un subjuego de columnas. Ideal cuando depende de Spark o cuando desea que varios servicios accedan a los mismos datos almacenados en Object Storage.
Columnas de Filas Optimizadas (ORC) Los datos se almacenan en recopilaciones de filas en un único archivo en formato de columna. Se utiliza para el procesamiento paralelo de recopilaciones de filas en un cluster. Ideal cuando las transacciones de lectura son más que transacciones de escritura o cuando la compresión es prioridad.
Delta Los datos se almacenan en un formato de columna que amplía los archivos de datos de Parquet con un log de transacciones basado en archivos JSON para transacciones ACID y manejo escalable de metadatos. Se utiliza para el soporte de transacciones.

Limitaciones

Las siguientes limitaciones se aplican a las tablas de Oracle AI Data Platform:

  • No puede definir una tabla externa en ningún archivo de datos o directorio dentro o en un volumen.
  • No puede definir una tabla externa en un cubo y/o su directorio que ya se utiliza para otra tabla externa o volumen externo
  • Las vistas no se pueden ver/mostrar en el catálogo maestro.

Creación de una tabla gestionada

Puede crear tablas para el esquema que gestione.

  1. Navegue hasta el esquema para el que desea crear una tabla.
  2. Seleccione el separador Tablas.
  3. Haga clic en Icono Crear Tabla Crear tabla.

    Crear bandeja de tablas con el tipo de tabla Gestionado seleccionado

  4. Seleccione Gestionado para el tipo de tabla.
  5. Seleccione el formato de la tabla en Formato de tabla gestionada.
  6. Arrastre y suelte un archivo con los datos de la tabla o haga clic para ir a la ubicación del archivo.
  7. Proporcione un nombre y la descripción de la tabla.
  8. Opcional: para agregar particiones, amplíe Claves de partición (opcional). Haga clic en Agregar partición y seleccione una columna de datos.
  9. Opcional: para agregar propiedades de tabla a los metadatos del catálogo de datos, amplíe Propiedades de tabla (opcional). Haga clic en Agregar propiedad y proporcione la propiedad y su valor.
  10. Haga clic en Create.

Crear una tabla externa

Puede crear una tabla externa con datos en OCI Object Storage.

  1. Navegue hasta el esquema para el que desea crear una tabla.
  2. Seleccione el separador Tablas.
  3. Haga clic en Icono Crear Tabla Crear tabla.

    Crear página de tabla abierta con el tipo de tabla Externo seleccionado

  4. Seleccione Externo para el tipo de tabla.
  5. Seleccione el compartimento, el cubo y la carpeta de OCI Object Storage donde se almacenan los datos. Los objetos que puede seleccionar se basan en los permisos de IAM del usuario conectado.
  6. Proporcione un nombre y la descripción de la tabla.
  7. Opcional: para agregar propiedades de tabla a los metadatos del catálogo de datos, amplíe Propiedades de tabla (opcional). Haga clic en Agregar propiedad y proporcione la propiedad y su valor.
  8. Haga clic en Create.

Editar una tabla

Puede modificar los detalles de las tablas que gestiona.

  1. Navegue hasta el esquema.
  2. Seleccione el separador Tablas.
  3. Junto a la tabla que desea editar, haga clic en Icono de tres puntos de acciones Acciones.
    • Haga clic en Cambiar Nombre para cambiar el nombre de la tabla. Introduzca un nuevo nombre y pulse Intro.
    • Haga clic en Editar descripción para cambiar la descripción de la tabla. Proporcione la nueva descripción y haga clic en Guardar.

Ver Detalles de Tabla

Puede ver los detalles de las tablas del esquema.

  1. Vaya al esquema. Haga clic en el separador Tablas.
  2. Haga clic en el nombre del volumen para el que desea ver los detalles. También puede hacer clic en Icono de tres puntos de acciones Acciones junto al volumen y, a continuación, en Ver.
  3. Haga clic en el separador Detalles.

Supresión de una tabla

Puede suprimir tablas del esquema que gestione.

  1. Vaya al esquema del que desea suprimir la tabla.
  2. Haga clic en el separador Tablas.
  3. Junto a la tabla que desea suprimir, haga clic en Icono de tres puntos de acciones Acciones y en Suprimir.
  4. Haga clic en Suprimir.