Use o Lakehouse com o Autonomous AI Database

Conheça os benefícios de usar o Lakehouse com o Autonomous AI Database.

Sobre o Lakehouse com o Autonomous AI Database
O Oracle Autonomous AI Database é uma solução versátil para acomodar qualquer tipo de dados e carga de trabalho.
O que é um Lakehouse?
Os lakehouses são repositórios centralizados projetados para armazenar grandes quantidades de dados brutos em seu formato nativo até que os dados sejam necessários para análise.
Principais recursos do Lakehouse do Autonomous AI Database
O Oracle Autonomous AI Database foi projetado para oferecer suporte integrado a cargas de trabalho do Lakehouse, eliminando a necessidade de gerenciamento ou instalação. Ele oferece recursos robustos para lidar com vários formatos de dados em diferentes ambientes de nuvem, garantindo uma análise de dados flexível e abrangente.

Tópico principal: Lakehouse

Sobre o Lakehouse com o Autonomous AI Database

O Oracle Autonomous AI Database é uma solução versátil para acomodar qualquer tipo de dados e carga de trabalho.

O Autonomous AI Database fornece armazenamento econômico, com um custo por TB comparável aos armazenamentos de objetos, ao mesmo tempo em que oferece suporte a diversos tipos de dados como JSON, Graph e Vector. Com o Autonomous AI Database, as empresas podem consolidar seus dados em uma única plataforma. Eles podem aproveitar recursos convergentes, como Oracle Machine Learning (OML), Graph, Spatial, Vector e Blockchain, para gerenciar seus dados de forma abrangente.

Para organizações que já têm Lakehouses existentes em outras plataformas, o Oracle Autonomous AI Database se integra perfeitamente, permitindo que as empresas se beneficiem dos recursos avançados do Autonomous AI Database sem interromper suas configurações atuais.

Para saber mais, experimente o LiveLabs Title Build a Lakehouse with Autonomous AI Lakehouse.

Tópico principal: Usar o Lakehouse com o Autonomous AI Database

O que é um Lakehouse?

Os lakehouses são repositórios centralizados projetados para armazenar grandes quantidades de dados brutos em seu formato nativo até que os dados sejam necessários para análise.

Eles são altamente flexíveis e escaláveis, o que os torna um poderoso complemento dos Lakehouses tradicionais, permitindo que as organizações armazenem e processem vários tipos de dados, incluindo estruturados, semiestruturados e não estruturados.

Principais atributos de um Lakehouse:

Abrir Formatos de Arquivo e Tabela

Os lakehouses armazenam dados em formatos de arquivo abertos, como CSV, Parquet e formatos de tabela como Iceberg. Isso garante interoperabilidade e flexibilidade no processamento de dados, permitindo que vários mecanismos gravem e leiam esses conjuntos de dados.
Suporte para vários mecanismos de processamento de dados

Os lakehouses são compatíveis com vários mecanismos de processamento de dados, como Apache Spark, Presto e Hive, permitindo diversas cargas de trabalho analíticas.
Esquema em Leitura

Os lakehouses geralmente usam uma abordagem de esquema em leitura, o que significa que não há necessidade de definir um esquema antecipadamente. Isso permite a ingestão rápida de dados, onde os dados podem ser carregados sem estruturação prévia, muito parecido com armazenamentos de objetos que "capturam dados agora e fazem perguntas mais tarde".
Suporte para dados não estruturados

Além dos dados estruturados, os Lakehouses podem armazenar dados não estruturados, como imagens (JPG), documentos (PDF, Word) e outros dados binários, oferecendo uma solução de armazenamento abrangente.

Tópico principal: Usar o Lakehouse com o Autonomous AI Database

Principais Recursos do Lakehouse do Autonomous AI Database

O Oracle Autonomous AI Database foi projetado para suportar cargas de trabalho Lakehouse de forma integrada, eliminando a necessidade de gerenciamento ou instalação. Ele oferece recursos robustos para lidar com vários formatos de dados em diferentes ambientes de nuvem, garantindo uma análise de dados flexível e abrangente.

Pronto para Cargas de Trabalho do Lakehouse
O Oracle Autonomous AI Database está totalmente pronto para cargas de trabalho do Lakehouse prontas para uso, sem exigir componentes adicionais. Essa prontidão se estende às principais tarefas do Lakehouse, como transformação de dados, gerenciamento de metadados e integração com ferramentas populares do Lakehouse, tudo disponível desde o primeiro dia sem configuração extra.
Multi-Cloud Support
Para organizações que já têm Lakehouses existentes em outras plataformas, o Autonomous AI Database se integra perfeitamente, permitindo que as empresas se beneficiem dos recursos avançados do Autonomous AI Database sem interromper suas configurações atuais.
Suporte a formatos de dados de ponta a ponta
O Oracle Autonomous AI Database foi projetado com a flexibilidade de lidar com um amplo espectro de formatos de dados, tornando-o uma solução universal para diversas fontes de dados e cargas de trabalho.
Recursos aprimorados: Autonomous AI Database para gerenciamento de dados não estruturados
Embora o Oracle Database seja reconhecido por seu poderoso processamento de dados estruturados e semiestruturados, o Autonomous AI Database estende seus recursos para lidar também com conjuntos de dados não estruturados.
Gerenciamento de Metadados Flexível
O Oracle Autonomous AI Database fornece aos usuários várias maneiras de definir metadados para seus conjuntos de dados, tornando o gerenciamento de dados mais adaptável e eficiente.
Suporte a Metadados Federados
O Autonomous AI Database suporta um catálogo de metadados federados, permitindo que os usuários unifiquem metadados de diferentes origens em uma única exibição, fornecendo uma interface unificada para gerenciamento de metadados.
Colaboração
Depois que os usuários terminam suas análises, eles geralmente precisam compartilhar seus resultados com outras pessoas. O Oracle Autonomous AI Database facilita o compartilhamento oferecendo várias maneiras de colaborar, fornecendo vantagens exclusivas sobre outros bancos de dados, como recursos de segurança integrados, protocolos abertos e conectividade de nuvem perfeita.
Ampla Compatibilidade com as Ferramentas do Oracle Database
O ambiente do Autonomous AI Database é totalmente compatível com uma ampla variedade de ferramentas de banco de dados Oracle.
Desempenho
O Autonomous AI Database inclui várias otimizações projetadas especificamente para consultar dados armazenados no Object Store e utilizar formatos de tabela abertos, como Apache Iceberg.

Tópico principal: Usar o Lakehouse com o Autonomous AI Database

Pronto para Cargas de Trabalho do Lakehouse

O Oracle Autonomous AI Database está totalmente pronto para cargas de trabalho do Lakehouse prontas para uso, sem a necessidade de componentes adicionais. Essa prontidão se estende às principais tarefas do Lakehouse, como transformação de dados, gerenciamento de metadados e integração com ferramentas populares do Lakehouse, tudo disponível desde o primeiro dia sem configuração extra.

Essa preparação abrangente é o que faz com que o Autonomous AI Database se destaque, oferecendo uma experiência integrada e sem complicações que acelera o tempo de insight para cargas de trabalho do Lakehouse. Isso significa que os usuários podem começar imediatamente a lidar com tarefas do Lakehouse sem qualquer configuração ou configuração, tornando-se uma verdadeira solução plug-and-play para ambientes do Lakehouse. Esse recurso integrado simplifica as operações, reduz os custos de manutenção e garante maior confiabilidade com menos erros.

O Autonomous AI Database fornece um conjunto de ferramentas para todos os tipos de usuários, de desenvolvedores a analistas de negócios, tornando a plataforma universal e acessível.

Descrição da ilustração Data-Lake-workloads.eps

Os desenvolvedores podem usar ferramentas como a API PL/SQL para operações avançadas, scripts e automação, permitindo uma integração perfeita com as ferramentas existentes e criando soluções de banco de dados personalizadas com eficiência. Consulte Referência de Pacote Fornecida pelo Autonomous AI Database para obter mais informações.

Para usuários corporativos, o Data Studio pode ser usado, uma interface baseada na web para simplificar a interação, a exploração e a visualização de dados. O Data Studio permite que usuários não técnicos obtenham insights, criem relatórios e colaborem de forma eficaz, reduzindo a complexidade e apoiando a tomada de decisões informada. Consulte A Página Visão Geral do Data Studio para obter mais informações.

Tópico principal: Principais Recursos do Autonomous AI Database do Lakehouse

Multi-Cloud Support

Para organizações que já têm Lakehouses existentes em outras plataformas, o Autonomous AI Database se integra perfeitamente, permitindo que as empresas se beneficiem dos recursos avançados do Autonomous AI Database sem interromper suas configurações atuais.

Forneça acesso ao Autonomous AI Database para seu Lakehouse concedendo os privilégios e o acesso necessários para que seu Lakehouse seja conectado ao Autonomous AI Database. Depois de fornecer as credenciais necessárias, o Autonomous AI Database pode se conectar perfeitamente aos Lakehouses em vários ambientes de nuvem, incluindo AWS, Azure, Google Cloud e armazenamento de objetos da Oracle OCI.

Esse recurso permite acessar e gerenciar com segurança seus dados, aproveitando os recursos de segurança nativos de cada provedor de nuvem. Com esse suporte a várias nuvens, você obtém a flexibilidade para implementar e dimensionar seu Lakehouse em diferentes plataformas de nuvem, mantendo um ambiente unificado e seguro.

O Oracle Autonomous AI Database oferece suporte à segurança nativa para outras nuvens. Para saber mais, consulte Usar ADNs (Amazon Resource Names) para Acessar Recursos da AWS, Usar o Controlador de Serviços do Azure para Acessar Recursos do Azure e Usar a Conta de Serviço do Google para Acessar Recursos do Google Cloud Platform para sua plataforma de nuvem correspondente.

Descrição da ilustração Data-Lake-multicloud.eps

Tópico principal: Principais Recursos do Autonomous AI Database do Lakehouse

Suporte ao formato de dados de ponta a ponta

O Oracle Autonomous AI Database foi projetado com a flexibilidade para lidar com um amplo espectro de formatos de dados, tornando-o uma solução universal para diversas fontes de dados e cargas de trabalho.

Independentemente de seus dados residirem em formatos estruturados, semiestruturados ou não estruturados, o Autonomous AI Database os suporta perfeitamente em vários ambientes de nuvem. Isso permite que as empresas ingeram, armazenem e analisem dados sem se preocupar com a compatibilidade de formatos.

O Autonomous AI Database fornece suporte nativo para formatos tradicionais, como CSV e JSON, bem como formatos avançados, como AVRO, Parquet e ORC. Consulte Consultar Dados Externos com o Autonomous AI Database para obter mais informações. O Autonomous AI Database suporta os seguintes formatos de arquivo: CSV, JSON, XML, AVRO, ORC, Parquet, Delta Sharing, Iceberg, Word, PDF.

Com o suporte adicional para o formato Iceberg Table, o Autonomous AI Database oferece recursos aprimorados para ambientes Lakehouse em larga escala. O Iceberg permite consultas otimizadas e de alto desempenho, melhor controle de versão e gerenciamento de dados mais fácil, o que o torna um bom ajuste para conjuntos de dados grandes e em evolução. Consulte Consultar Tabelas de Iceberg do Apache para obter mais informações.

Tópico principal: Principais Recursos do Autonomous AI Database do Lakehouse

Recursos aprimorados: Autonomous AI Database para gerenciamento de dados não estruturados

Embora o Oracle Database seja reconhecido por seu poderoso processamento de dados estruturados e semiestruturados, o Autonomous AI Database também estende seus recursos para lidar com conjuntos de dados não estruturados.

Esses recursos incluem gerenciar e analisar uma ampla gama de formatos, como JPG, PDF, documentos do Word e muito mais. Com esses avanços, o Autonomous AI Database traz uma solução abrangente para empresas que lidam com fontes de dados não estruturadas.

Insights Orientados por IA com Geração Aumentada de Recuperação (RAG): O Autonomous AI Database integra modelos avançados de IA, permitindo o Vector Search para dados não estruturados. Isso permite a recuperação eficiente de informações relevantes em conjuntos de dados massivos usando IA, aprimorando a precisão e a velocidade da pesquisa. Consulte Selecionar IA com Geração Aumentada de Recuperação (RAG) para obter mais informações.
Indexação de Texto Completo: O Autonomous AI Database suporta a criação de índices de texto completo em arquivos não estruturados, possibilitando a execução de pesquisas avançadas de texto em documentos como PDFs, arquivos do Word e muito mais. Esse recurso melhora muito a forma como o conteúdo não estruturado pode ser consultado, indexado e analisado. Consulte Usar Pesquisa de Texto Completo em Arquivos no Serviço Object Storage
Fazer Parsing e Carregar Dados Não Estruturados: Os recursos aprimorados de análise e ingestão de dados do Autonomous AI Database permitem que os usuários carreguem dados não estruturados de forma integrada, transformando-os automaticamente em um formato tabular, pronto para ser carregado no banco de dados. Consulte Executar Extração de Tabela da Imagem para obter mais informações.
IA como Fonte de Dados (Prompt-to-Table): Aproveitando a IA, o Autonomous AI Database permite a funcionalidade prompt-to-table, permitindo que os usuários gerem dados diretamente de modelos de IA e os carreguem em tabelas. Isso abre possibilidades para extrair insights valiosos de resultados gerados por IA e usá-los como uma nova fonte de dados estruturados. Consulte Carregando Dados da Origem de AI

Esses recursos expandidos posicionam o Autonomous AI Database como uma ferramenta poderosa para lidar com as crescentes demandas de dados não estruturados, além de aproveitar soluções com tecnologia de IA, tornando-o uma plataforma versátil e preparada para o futuro para desafios de dados modernos.

Tópico principal: Principais Recursos do Autonomous AI Database do Lakehouse

Gerenciamento Flexível de Metadados

O Oracle Autonomous AI Database fornece aos usuários várias maneiras de definir metadados para seus conjuntos de dados, tornando o gerenciamento de dados mais adaptável e eficiente.

Integração de Metadados Baseada em Catálogo
Os usuários podem trazer metadados de vários catálogos para uma exibição centralizada, facilitando o controle e a manutenção da consistência dos dados em toda a organização. Os catálogos suportados incluem:
- OCI Data Catalog: Uma ferramenta na Oracle Cloud Infrastructure (OCI) que ajuda os usuários a descobrir, organizar e gerenciar ativos de dados. Ele oferece uma visão clara de todos os ativos de dados, ajudando os usuários a manter a conformidade, garantir a qualidade dos dados e facilitar a colaboração entre as equipes. Consulte Exemplo: MovieStream Cenário para obter mais informações.
- AWS Glue: Um serviço ETL gerenciado (extrair, transformar, carregar) do Amazon Web Services que inclui um catálogo de dados para organizar e gerenciar metadados. Consulte Consultar Dados Externos com o AWS Glue Data Catalog para obter mais informações.
Definição Manual de Metadados
Os usuários também podem definir metadados diretamente no nível da tabela para conjuntos de dados em armazenamentos de objetos, como o Oracle Cloud Infrastructure (OCI) Object Storage ou o Amazon S3. Isso permite a organização personalizada de dados para arquivos individuais ou grupos de arquivos, adaptados às necessidades do usuário. O Autonomous AI Database também pode inferir automaticamente metadados, como nomes de colunas e tipos de dados, para economizar tempo e reduzir erros. Por exemplo, ao carregar um arquivo CSV, o sistema pode detectar automaticamente cabeçalhos como nomes de coluna e designar tipos de dados apropriados, como número ou varchar2, com base no conteúdo. Isso ajuda os usuários a preparar rapidamente seus dados para análise sem intervenção manual, reduzindo o tempo de configuração e minimizando a chance de erros.

Tópico principal: Principais Recursos do Autonomous AI Database do Lakehouse

Suporte a Metadados Federados

O Autonomous AI Database suporta um catálogo de metadados federados, permitindo que os usuários unifiquem metadados de diferentes origens em uma única exibição, fornecendo uma interface unificada para gerenciamento de metadados.

Essa abordagem simplifica o gerenciamento de metadados em vários ambientes, conectando origens de dados em várias nuvens e plataformas. Seja usando metadados baseados em catálogo ou definindo-os manualmente, todas as informações estão disponíveis em um catálogo unificado para facilitar a navegação. Por exemplo, uma organização pode usar essa visão federada para gerenciar ativos de dados da AWS e da Oracle Cloud, garantindo governança e descoberta consistentes em todas as plataformas.

Descrição da ilustração Data-Lake-Uni-dcat.eps

Tópico principal: Principais Recursos do Autonomous AI Database do Lakehouse

Collaboration

Depois que os usuários terminam sua análise, eles geralmente precisam compartilhar seus resultados com outras pessoas. O Oracle Autonomous AI Database facilita o compartilhamento oferecendo várias maneiras de colaborar, fornecendo vantagens exclusivas sobre outros bancos de dados, como recursos de segurança integrados, protocolos abertos e conectividade de nuvem perfeita.

Essas opções são flexíveis e seguras, de modo que atendem a diferentes necessidades de colaboração:

Protocolo de Compartilhamento Delta: Permite que você compartilhe dados fora da Oracle usando um protocolo aberto chamado Compartilhamento Delta. Ele oferece suporte ao compartilhamento seguro de dados com parceiros externos, sem precisar de integração complexa, o que o torna ideal para análises entre nuvens e plataformas. Dessa forma, os dados podem ser usados sem problemas em diferentes ferramentas de análise que não fazem parte da Oracle. Consulte Compartilhar Versões de Dados Usando o Serviço Object Storage para obter mais informações.
Links da Nuvem: Você pode compartilhar dados entre diferentes instâncias do Autonomous AI Database usando links de nuvem seguros. Por exemplo, os Cloud Links são particularmente eficazes para conectar diferentes bancos de dados. Isso garante disponibilidade consistente de dados e reduz a latência para aplicativos que precisam de acesso rápido e confiável aos dados em vários bancos de dados, sem a necessidade de copiar ou duplicar. Ele mantém a colaboração suave para as equipes que estão espalhadas e precisam trabalhar juntas. Consulte Compartilhar Dados Ativos Usando Conexão Direta
Hiperlinks de Tabela: Você pode compartilhar dados diretamente criando URLs especiais que dão acesso aos dados sem precisar de um log-in separado. Os usuários podem controlar as permissões e definir tempos de expiração para esses URLs, garantindo opções de compartilhamento seguras e flexíveis. Esse recurso foi criado especificamente para clientes REST. Consulte Criar um Hiperlink de Tabela para uma Tabela ou uma View para obter mais informações.

Descrição da ilustração data-lake-data-share.eps

Tópico principal: Principais Recursos do Autonomous AI Database do Lakehouse

Ampla Compatibilidade com o Oracle Database Tools

O ambiente do Autonomous AI Database é totalmente compatível com uma ampla variedade de ferramentas de banco de dados Oracle.

Qualquer ferramenta que você já use para interagir com bancos de dados Oracle, seja para visualização, análise, ETL ou administração de dados, também pode ser aproveitada perfeitamente para analisar conjuntos de dados no Autonomous AI Database. Essa compatibilidade garante uma experiência sem atrito, permitindo que os usuários integrem o Autonomous AI Database em seus fluxos de trabalho existentes sem a necessidade de adotar novas ferramentas ou processos, maximizando assim a eficiência e reduzindo a curva de aprendizado.

Consulte A Página Visão Geral do Data Studio, para obter informações sobre algumas das ferramentas disponíveis para uso com bancos de dados Oracle.

Tópico principal: Principais Recursos do Autonomous AI Database do Lakehouse

Desempenho

O Autonomous AI Database inclui várias otimizações projetadas especificamente para consultar dados armazenados no Object Store e utilizar formatos de tabela abertos, como o Apache Iceberg.

Data Lake Accelerator

O Data Lake Accelerator é um serviço de expansão dinâmica que aprimora significativamente o desempenho da consulta, descarregando operações de verificação intensivas, incluindo filtragem, projeção e descompressão do Autonomous AI Database para um pool dedicado de recursos de computação. Esse serviço provisiona e adiciona dinamicamente ECPUs somente durante a execução da consulta, permitindo que grandes verificações sejam concluídas mais rapidamente, paralelizando o processamento de dados diretamente na origem, sem exigir que os dados sejam carregados no banco de dados. Após a conclusão da consulta, os recursos alocados são liberados automaticamente, garantindo uma utilização eficiente baseada no consumo. Consulte Data Lake Accelerator para obter mais informações.

Cache de Tabela Externa

O cache de tabela externa permite armazenar localmente dados externos acessados com frequência. Quando você usa o cache, as consultas em tabelas externas podem recuperar dados diretamente de dentro do Autonomous AI Database, tornando-os significativamente mais rápidos. Você não precisa alterar instruções SQL ou fluxos de trabalho existentes para se beneficiar de acesso mais rápido, pois esse mecanismo de armazenamento em cache é totalmente transparente para os aplicativos. Você pode criar um cache de tabela externa para tabelas externas particionadas e não particionadas criadas em Tabelas Parquet, ORC, AVRO, CSV e Iceberg. Consulte Usar o Lake Cache para Melhorar o Desempenho de Tabelas Externas para obter mais informações.

Particionamento Implícito

O particionamento implícito no Autonomous AI Database reconhece automaticamente padrões comuns de nomeação de pastas e arquivos nos seus caminhos do Object Store, por exemplo, '.../country=US/year=2024/month=01/'. O banco de dados trata essas convenções de nomenclatura como chaves de partição, permitindo ignorar arquivos e pastas que são irrelevantes para seus filtros de consulta. Isso oferece benefícios de remoção de partição sem exigir que você defina manualmente partições na DDL da tabela ou altere a estrutura de diretório existente. Como resultado, as consultas verificam menos dados do Object Store e oferecem resultados mais rápidos, especialmente ao trabalhar com grandes conjuntos de dados. Consulte Consultar Tabelas Externas com Particionamento Implícito para obter mais informações.

Escolhendo o Recurso Certo

Recurso	Caso de Uso	Volume de Dados
Cache de Tabela Externa	Utilize para painéis repetidos, interativos ou programados.	Médio (GBs para TBs baixos)
Data Lake Accelerator	Utilize para dimensionar varreduras pesadas ou adhoc em dados extensivos.	Muito Grande (TBs para PBs)
Particionamento Implícito	Utilize para consultar ou analisar grandes conjuntos de dados organizados por padrões de nomeação de pastas ou arquivos, por exemplo, por data, região ou outros atributos, no Object Store.	Médio a Grande (GBs para TBs)
Híbrido	Tabela externa Cache para armazenar em cache subconjuntos de dados acessados com frequência (quentes) e Data Lake Accelerator para consultar os dados históricos completos.	Todos os volumes

Tópico principal: Principais Recursos do Autonomous AI Database do Lakehouse

Documentação do Oracle Cloud Infrastructure

Use o Lakehouse com o Autonomous AI Database

Sobre o Lakehouse com o Autonomous AI Database

O que é um Lakehouse?

Principais Recursos do Lakehouse do Autonomous AI Database

Pronto para Cargas de Trabalho do Lakehouse

Multi-Cloud Support

Suporte ao formato de dados de ponta a ponta

Recursos aprimorados: Autonomous AI Database para gerenciamento de dados não estruturados

Gerenciamento Flexível de Metadados

Suporte a Metadados Federados

Collaboration

Ampla Compatibilidade com o Oracle Database Tools

Desempenho