Tabelas
As tabelas definem a estrutura de seus dados.
Você pode carregar novos dados em suas tabelas ou dados de referência em um local existente. Você pode definir permissões de controle de acesso detalhadas em tabelas criando permissões de tabela.
As tabelas podem ser externas ou gerenciadas.
Tabelas externas
Uma tabela externa define uma estrutura para dados armazenados em um local não gerenciado pelo Oracle AI Data Platform Workbench. Quando você cria uma tabela externa no AI Data Platform Workbench, o ciclo de vida dos metadados é gerenciado pelo AI Data Platform Workbench. Quando você exclui uma tabela externa, somente a definição da tabela é excluída. Os dados referenciados pela tabela externa não são excluídos.
Certifique-se de que seus usuários tenham as seguintes políticas do serviço IAM necessárias para criar tabelas externas:
allow group <GroupName> to read buckets in compartment id <external-data-CompartmentId>
allow group <GroupName> to inspect objects in compartment id <external-data-CompartmentId>Políticas adicionais do IAM são necessárias para tabelas externas. Para obter mais informações, consulte Políticas do IAM para o Oracle AI Data Platform Workbench.
Tabelas Gerenciadas
Uma tabela gerenciada define uma estrutura para dados armazenados na AI Data Platform e só pode ser acessada por usuários do AI Data Platform Workbench.
Quando você exclui uma tabela gerenciada, a definição da tabela e os dados da tabela são excluídos.
Formatos de Tabela Suportados
| Formatar | Descrição | Utilização |
|---|---|---|
| Valores Separados por Vírgulas (CSV) | Os dados são armazenados como um arquivo de texto com um formato de arquivo baseado em linha especificado para estruturar os dados. Normalmente, a primeira linha do arquivo é uma linha de cabeçalho que contém nomes de colunas para os dados. | Usado para trocar dados tabulares entre sistemas. Cada linha do arquivo é uma linha de uma tabela. |
| JavaScript Object Notation (JSON) | Os dados são armazenados em um formato padrão baseado em texto para representar dados estruturados com base na sintaxe de objeto JavaScript. O JSON suporta listas de objetos ou estruturas hierárquicas. | Usado em aplicativos de fluxo. O JSON simplifica o armazenamento de dados relacionados com relações complexas num único documento e evita a conversão caótica de listas para um modelo de dados relacional. Observe que o JSON não é splittable. |
| Avro | Os dados são armazenados em um formato binário baseado em linha, enquanto o esquema é armazenado em formato JSON para minimizar o tamanho do arquivo e maximizar a eficiência. O Avro tem suporte confiável para a evolução do esquema, gerenciando campos adicionados, ausentes e alterados. Isso permite que softwares antigos leiam novos dados e novos softwares leiam dados antigos. Também conhecido como sistema de serialização de dados. | Usado para armazenamento de dados, pois os arquivos avro são divisíveis e compactáveis. O armazenamento serializado baseado em linhas é ideal para transações de gravação pesada, como a inserção de dados na AI Data Platform. O Avro também é uma boa escolha quando a evolução do esquema é crítica durante gravações de alta velocidade. |
| Parquet | Os dados são armazenados em um formato de dados colunar e são altamente compactáveis e divisíveis. Parquet é otimizado para o paradigma Write Once Read Many (WORM). Ele escreve lentamente, mas lê incrivelmente rapidamente, especialmente quando você acessa apenas um subconjunto de colunas. | Usado para resolver problemas de Big Data, pois os algoritmos de compactação funcionam melhor com o formato de dados colunar. Você pode armazenar Big Data em vários formatos, como imagens, vídeos, documentos e tabelas de dados estruturados. Parquet é uma boa escolha para cargas de trabalho pesadas ao ler partes de dados. Por exemplo, quando o conjunto de dados tem muitas colunas, mas você só deseja acessar um subconjunto de colunas. Ideal quando você depende do Spark ou quando deseja que vários serviços acessem os mesmos dados armazenados no Object Storage. |
| ORC (Optimized Row Columnar, Coluna de linha otimizada) | Os dados são armazenados em coleções de linhas em um único arquivo em formato colunar. | Usado para processamento paralelo de coleções de linhas em um cluster. Ideal quando as transações de leitura são mais do que transações de gravação ou quando a compactação é prioridade. |
| Delta | Os dados são armazenados em um formato colunar que estende os arquivos de dados Parquet com um log de transações baseado em arquivo JSON para transações ACID e tratamento escalável de metadados. | Usado para suporte a transações. |
Limitações
As seguintes limitações se aplicam a tabelas no Oracle AI Data Platform:
- Não é possível definir uma tabela externa em nenhum arquivo de dados ou diretório dentro/em um volume.
- Você não pode definir uma tabela externa em um bucket e/ou seu diretório que já esteja sendo usado para outra tabela externa ou volume externo
- As exibições não podem ser exibidas/listadas no Catálogo Mestre.
Editar uma Tabela
É possível modificar os detalhes das tabelas que você gerencia.
- Navegue até o seu esquema.
- Selecione a guia Tabelas.
- Ao lado da tabela que você deseja editar, clique em
Ações.- Clique em Renomear para alterar o nome da sua tabela. Informe um novo nome e pressione Enter.
- Clique em Editar Descrição para alterar a descrição da tabela. Forneça a nova descrição e clique em Salvar.

