Tabelas

As tabelas definem a estrutura de seus dados.

Você pode carregar novos dados em suas tabelas ou dados de referência em um local existente. Você pode definir permissões de controle de acesso detalhadas em tabelas criando permissões de tabela.

As tabelas podem ser externas ou gerenciadas.

Tabelas externas

Uma tabela externa define uma estrutura para dados armazenados em um local não gerenciado pelo Oracle AI Data Platform Workbench. Quando você cria uma tabela externa no AI Data Platform Workbench, o ciclo de vida dos metadados é gerenciado pelo AI Data Platform Workbench. Quando você exclui uma tabela externa, somente a definição da tabela é excluída. Os dados referenciados pela tabela externa não são excluídos.

Certifique-se de que seus usuários tenham as seguintes políticas do serviço IAM necessárias para criar tabelas externas:

allow group <GroupName> to read buckets in compartment id <external-data-CompartmentId>
allow group <GroupName> to inspect objects in compartment id <external-data-CompartmentId>

Políticas adicionais do IAM são necessárias para tabelas externas. Para obter mais informações, consulte Políticas do IAM para o Oracle AI Data Platform Workbench.

Tabelas Gerenciadas

Uma tabela gerenciada define uma estrutura para dados armazenados na AI Data Platform e só pode ser acessada por usuários do AI Data Platform Workbench.

Quando você exclui uma tabela gerenciada, a definição da tabela e os dados da tabela são excluídos.

Formatos de Tabela Suportados

Formatar Descrição Utilização
Valores Separados por Vírgulas (CSV) Os dados são armazenados como um arquivo de texto com um formato de arquivo baseado em linha especificado para estruturar os dados. Normalmente, a primeira linha do arquivo é uma linha de cabeçalho que contém nomes de colunas para os dados. Usado para trocar dados tabulares entre sistemas. Cada linha do arquivo é uma linha de uma tabela.
JavaScript Object Notation (JSON) Os dados são armazenados em um formato padrão baseado em texto para representar dados estruturados com base na sintaxe de objeto JavaScript. O JSON suporta listas de objetos ou estruturas hierárquicas. Usado em aplicativos de fluxo. O JSON simplifica o armazenamento de dados relacionados com relações complexas num único documento e evita a conversão caótica de listas para um modelo de dados relacional. Observe que o JSON não é splittable.
Avro Os dados são armazenados em um formato binário baseado em linha, enquanto o esquema é armazenado em formato JSON para minimizar o tamanho do arquivo e maximizar a eficiência. O Avro tem suporte confiável para a evolução do esquema, gerenciando campos adicionados, ausentes e alterados. Isso permite que softwares antigos leiam novos dados e novos softwares leiam dados antigos. Também conhecido como sistema de serialização de dados. Usado para armazenamento de dados, pois os arquivos avro são divisíveis e compactáveis. O armazenamento serializado baseado em linhas é ideal para transações de gravação pesada, como a inserção de dados na AI Data Platform. O Avro também é uma boa escolha quando a evolução do esquema é crítica durante gravações de alta velocidade.
Parquet Os dados são armazenados em um formato de dados colunar e são altamente compactáveis e divisíveis. Parquet é otimizado para o paradigma Write Once Read Many (WORM). Ele escreve lentamente, mas lê incrivelmente rapidamente, especialmente quando você acessa apenas um subconjunto de colunas. Usado para resolver problemas de Big Data, pois os algoritmos de compactação funcionam melhor com o formato de dados colunar. Você pode armazenar Big Data em vários formatos, como imagens, vídeos, documentos e tabelas de dados estruturados. Parquet é uma boa escolha para cargas de trabalho pesadas ao ler partes de dados. Por exemplo, quando o conjunto de dados tem muitas colunas, mas você só deseja acessar um subconjunto de colunas. Ideal quando você depende do Spark ou quando deseja que vários serviços acessem os mesmos dados armazenados no Object Storage.
ORC (Optimized Row Columnar, Coluna de linha otimizada) Os dados são armazenados em coleções de linhas em um único arquivo em formato colunar. Usado para processamento paralelo de coleções de linhas em um cluster. Ideal quando as transações de leitura são mais do que transações de gravação ou quando a compactação é prioridade.
Delta Os dados são armazenados em um formato colunar que estende os arquivos de dados Parquet com um log de transações baseado em arquivo JSON para transações ACID e tratamento escalável de metadados. Usado para suporte a transações.

Limitações

As seguintes limitações se aplicam a tabelas no Oracle AI Data Platform:

  • Não é possível definir uma tabela externa em nenhum arquivo de dados ou diretório dentro/em um volume.
  • Você não pode definir uma tabela externa em um bucket e/ou seu diretório que já esteja sendo usado para outra tabela externa ou volume externo
  • As exibições não podem ser exibidas/listadas no Catálogo Mestre.

Criar uma Tabela Gerenciada

Você pode criar tabelas para o esquema que gerencia.

  1. Navegue até o esquema para o qual deseja criar uma tabela.
  2. Selecione a guia Tabelas.
  3. Clique em Ícone Criar tabela Criar Tabela.

    Criar bandeja de tabela com tipo de tabela Gerenciado selecionado

  4. Selecione Gerenciado para seu Tipo de Tabela.
  5. Selecione o formato da tabela em Formato da tabela gerenciada.
  6. Arraste e solte um arquivo com os dados da tabela ou clique para procurar o local do arquivo.
  7. Forneça um nome e descrição para a sua tabela.
  8. Opcional: Para adicionar partições, expanda Chaves de partição (opcional). Clique em Adicionar Partição e selecione uma coluna de dados.
  9. Opcional: Para adicionar propriedades de tabela aos metadados do catálogo de dados, expanda Propriedades de tabela (opcional). Clique em Adicionar Propriedade e forneça a propriedade e seu valor.
  10. Clique em Criar.

Criar uma Tabela Externa

Você pode criar uma tabela externa com dados no OCI Object Storage.

  1. Navegue até o esquema para o qual deseja criar uma tabela.
  2. Selecione a guia Tabelas.
  3. Clique em Ícone Criar tabela Criar Tabela.

    Criar página de tabela aberta com o tipo de tabela Externo selecionado

  4. Selecione Externo para seu Tipo de Tabela.
  5. Selecione o compartimento, o bucket e a pasta no OCI Object Storage no qual os dados são armazenados. Os objetos que você pode selecionar são baseados nas permissões do IAM do usuário conectado.
  6. Forneça um nome e descrição para a sua tabela.
  7. Opcional: Para adicionar propriedades de tabela aos metadados do catálogo de dados, expanda Propriedades de tabela (opcional). Clique em Adicionar Propriedade e forneça a propriedade e seu valor.
  8. Clique em Criar.

Editar uma Tabela

É possível modificar os detalhes das tabelas que você gerencia.

  1. Navegue até o seu esquema.
  2. Selecione a guia Tabelas.
  3. Ao lado da tabela que você deseja editar, clique em Ícone de três pontos de ações Ações.
    • Clique em Renomear para alterar o nome da sua tabela. Informe um novo nome e pressione Enter.
    • Clique em Editar Descrição para alterar a descrição da tabela. Forneça a nova descrição e clique em Salvar.

Exibir Detalhes da Tabela

Você pode exibir os detalhes das tabelas no esquema.

  1. Navegue até o seu esquema. Clique na guia Tabelas.
  2. Clique no nome do volume cujos detalhes você deseja exibir. Você também pode clicar em Ícone de três pontos de ações Ações ao lado do volume e, em seguida, clicar em Exibir.
  3. Clique na guia Detalhes.

Excluir uma Tabela

Você pode excluir tabelas do esquema que gerencia.

  1. Navegue até o esquema do qual deseja excluir a tabela.
  2. Clique na guia Tabelas.
  3. Ao lado da tabela que você deseja excluir, clique em Ícone de três pontos de ações Ações e clique em Excluir.
  4. Clique em Excluir.