Tablas
Las tablas definen la estructura de los datos.
Puede cargar nuevos datos en las tablas o datos de referencia en una ubicación existente. Puede definir permisos de control de acceso detallados en las tablas mediante la creación de permisos de tabla.
Las tablas pueden ser externas o gestionadas.
Tablas externas
Una tabla externa define una estructura para los datos que se almacenan en una ubicación no gestionada por Oracle AI Data Platform Workbench. Al crear una tabla externa en AI Data Platform Workbench, el ciclo de vida de los metadatos lo gestiona AI Data Platform Workbench. Al suprimir una tabla externa, solo se suprime la definición de tabla. Los datos a los que hace referencia la tabla externa no se suprimen.
Asegúrese de que los usuarios tienen las siguientes políticas de IAM necesarias para crear tablas externas:
allow group <GroupName> to read buckets in compartment id <external-data-CompartmentId>
allow group <GroupName> to inspect objects in compartment id <external-data-CompartmentId>Se necesitan políticas de IAM adicionales para las tablas externas. Para obtener más información, consulte Políticas de IAM para el área de trabajo de Oracle AI Data Platform.
Tablas gestionadas
Una tabla gestionada define una estructura para los datos que se almacenan en AI Data Platform y a la que solo pueden acceder los usuarios de AI Data Platform Workbench.
Al suprimir una tabla gestionada, se suprimen la definición de tabla y los datos de tabla.
Formatos de tabla soportados
| Formato | Descripción | Uso |
|---|---|---|
| Valores separados por coma (CSV) | Los datos se almacenan como un archivo de texto con un formato de archivo basado en filas especificado para estructurar los datos. Normalmente, la primera fila del archivo es una fila de cabecera que contiene nombres de columnas para los datos. | Se utiliza para intercambiar datos tabulares entre sistemas. Cada fila del archivo es una fila de una tabla. |
| Notaciones de objetos de JavaScript (JSON) | Los datos se almacenan en un formato estándar basado en texto para representar datos estructurados basados en la sintaxis de objeto JavaScript. JSON soporta listas de objetos o estructuras jerárquicas. | Se utiliza en aplicaciones de flujo. JSON simplifica el almacenamiento de datos relacionados con relaciones complejas en un solo documento y evita la conversión de listas caóticas a un modelo de datos relacional. Tenga en cuenta que JSON no se puede dividir. |
| Avro | Los datos se almacenan en un formato binario basado en filas mientras que el esquema se almacena en formato JSON para minimizar el tamaño del archivo y maximizar la eficiencia. Avro cuenta con un soporte fiable para la evolución del esquema mediante la gestión de campos agregados, faltantes y modificados. Esto permite que el software antiguo lea datos nuevos y que el nuevo software lea datos antiguos. También conocido como sistema de serialización de datos. | Se utiliza para el almacenamiento de datos, ya que los archivos avro se pueden dividir y comprimir. El almacenamiento basado en filas serializado es ideal para transacciones de escritura intensa, como la inserción de datos en AI Data Platform. Avro también es una buena opción cuando la evolución del esquema es crítica durante las escrituras de alta velocidad. |
| Parquet | Los datos se almacenan en un formato de datos en columnas y son altamente comprimibles y dividibles. Parquet está optimizado para el paradigma Write Once Read Many (WORM). Escribe lentamente, pero lee increíblemente rápido, especialmente cuando solo se accede a un subconjunto de columnas. | Se utiliza para resolver problemas de Big Data a medida que los algoritmos de compresión funcionan mejor con el formato de datos en columnas. Puede almacenar Big Data en varios formatos, como imágenes, vídeos, documentos y tablas de datos estructurados. Parquet es una buena opción para cargas de trabajo pesadas al leer partes de datos. Por ejemplo, cuando el juego de datos tiene muchas columnas, pero solo desea acceder a un subjuego de columnas. Ideal cuando depende de Spark o cuando desea que varios servicios accedan a los mismos datos almacenados en Object Storage. |
| Columnas de Filas Optimizadas (ORC) | Los datos se almacenan en recopilaciones de filas en un único archivo en formato de columna. | Se utiliza para el procesamiento paralelo de recopilaciones de filas en un cluster. Ideal cuando las transacciones de lectura son más que transacciones de escritura o cuando la compresión es prioridad. |
| Delta | Los datos se almacenan en un formato de columna que amplía los archivos de datos de Parquet con un log de transacciones basado en archivos JSON para transacciones ACID y manejo escalable de metadatos. | Se utiliza para el soporte de transacciones. |
Limitaciones
Las siguientes limitaciones se aplican a las tablas de Oracle AI Data Platform:
- No puede definir una tabla externa en ningún archivo de datos o directorio dentro o en un volumen.
- No puede definir una tabla externa en un cubo y/o su directorio que ya se utiliza para otra tabla externa o volumen externo
- Las vistas no se pueden ver/mostrar en el catálogo maestro.
Editar una tabla
Puede modificar los detalles de las tablas que gestiona.
- Navegue hasta el esquema.
- Seleccione el separador Tablas.
- Junto a la tabla que desea editar, haga clic en
Acciones.- Haga clic en Cambiar Nombre para cambiar el nombre de la tabla. Introduzca un nuevo nombre y pulse Intro.
- Haga clic en Editar descripción para cambiar la descripción de la tabla. Proporcione la nueva descripción y haga clic en Guardar.
Ver Detalles de Tabla
Puede ver los detalles de las tablas del esquema.
- Vaya al esquema. Haga clic en el separador Tablas.
- Haga clic en el nombre del volumen para el que desea ver los detalles. También puede hacer clic en
Acciones junto al volumen y, a continuación, en Ver. - Haga clic en el separador Detalles.

