1 Visão Geral do Oracle AI Data Platform and Workbench
Este capítulo fornece informações e procedimentos para novos usuários que estão se familiarizando com o Oracle AI Data Platform Workbench.
Para que é usado o Oracle AI Data Platform Workbench?
O Oracle AI Data Platform Workbench fornece um ambiente integrado para criar, orquestrar e operacionalizar dados e fluxos de trabalho de IA.
- Simplifique a Descoberta e a Governança de Dados: O AI Data Platform Workbench fornece um repositório de metadados centralizado (Catálogo Mestre) que aprimora a capacidade de pesquisa e a governança de dados estruturados e não estruturados.
- Habilitar Colaboração Segura de Dados: por meio do controle de acesso baseado em RBAC, o AI Data Platform Workbench permite que diferentes equipes trabalhem em conjuntos de dados compartilhados, mantendo políticas de segurança rigorosas.
- Acelere a Preparação e o Processamento de Dados: com notebooks integrados e orquestração de workflow, os usuários podem limpar, transformar e enriquecer dados com eficiência.
- Suporte a Análise Avançada e IA/ML: O AI Data Platform Workbench se integra ao Apache Spark, permitindo que cientistas e analistas de dados executem cálculos complexos e treinamentos de modelos diretamente em seu data lake.
- Garanta uma Integração Perfeita entre Origens de Dados: O AI Data Platform Workbench suporta catálogos externos do Autonomous Database (ADB), do Object Storage (OS) e de origens de dados de terceiros, permitindo que OS usuários consultem e analisem dados sem duplicação.
Integração Gerenciada com Código-Fonte Aberto
O Oracle AI Data Platform Workbench aproveita e estende as tecnologias de código-fonte aberto para fornecer uma experiência avançada e gerenciada.
- Apache Spark: A camada de computação do AI Data Platform Workbench é alimentada pelo Spark, permitindo o processamento de dados escalável e distribuído.
- Suporte ao Delta Lake: O AI Data Platform Workbench aproveita o Delta Lake para aprimorar a confiabilidade dos dados, as transações ACID e a evolução do esquema.
- Compatibilidade com Iceberg e Hudi via Delta Uniform: por meio do Delta Uniform, o AI Data Platform Workbench estende o suporte ao Apache Iceberg e ao Apache Hudi, permitindo a interoperabilidade em diferentes formatos de armazenamento. Isso garante que os usuários possam adotar uma estratégia de formato de tabela unificada, mantendo a execução eficiente de consultas e a governança de dados.
- Integração JDBC para Ferramentas de BI: O AI Data Platform Workbench fornece drivers JDBC, permitindo conectividade perfeita com ferramentas de BI externas, como Oracle Analytics Cloud (OAC) e plataformas de visualização de terceiros.
Personas para Usuários da Oracle AI Data Platform
A Oracle AI Data Platform atende a uma variedade de usuários em diferentes funções dentro de uma organização, cada uma com necessidades e requisitos exclusivos.
- Engenheiros de Dados - Os engenheiros de dados trabalham com pipelines de dados em larga escala, transformando dados brutos em formatos utilizáveis para análise. Eles contam com os recursos robustos da AI Data Platform para projetar e gerenciar fluxos de trabalho de dados, ingerir dados de várias fontes e garantir a qualidade dos dados. Eles estão altamente focados em automatizar processos, otimizar recursos de computação e integrar diferentes sistemas de dados perfeitamente.
- Analistas de Dados - Os analistas de dados usam a AI Data Platform para descobrir, analisar e gerar insights a partir de dados. Eles exigem uma interface intuitiva e ferramentas para consultar e analisar grandes conjuntos de dados. A AI Data Platform os capacita com notebooks interativos e integração perfeita com ferramentas de business intelligence (BI), ajudando-os a transformar dados brutos em insights acionáveis para os tomadores de decisão.
- Cientistas de Dados - Os cientistas de dados aproveitam os recursos de computação escaláveis da AI Data Platform para machine learning e tarefas avançadas de análise. Eles precisam de acesso a diversos conjuntos de dados, poderosas ferramentas de processamento e a capacidade de executar modelos complexos. Os notebooks com tecnologia Spark da AI Data Platform, a integração de IA/ML e o suporte a bibliotecas de código-fonte aberto permitem que os cientistas de dados criem, testem e implantem modelos na plataforma.
- Administradores de Dados - Esses usuários garantem que todos os dados sejam tratados em conformidade com as regulamentações do setor e as políticas organizacionais. Eles se concentram em manter a privacidade dos dados, auditar o acesso e monitorar o uso de dados em toda a organização. A AI Data Platform ajuda a gerenciar metadados, impor controles de acesso baseados em atribuições (RBAC) e garantir a governança adequada por meio de catalogação, rastreamento de linhagem e políticas de segurança.
Casos de Uso Comuns da Oracle AI Data Platform
A Oracle AI Data Platform atende a uma variedade de casos de uso em setores e funções de negócios.
Arquitetura Medallion
- Implemente uma arquitetura medalhão com camadas de bronze, prata e ouro.
- Use o Delta Uniform e o Iceberg para armazenamento eficiente de dados e otimização de consultas.
- Permita acesso de cópia zero a fontes de dados externas para análises contínuas.
ETL e Engenharia de Dados
- Use workflows e notebooks baseados no Spark para processar, transformar e enriquecer dados brutos.
- Automatize pipelines de dados com orquestração de workflow low-code/no-code.
- Lidar com processamento em lote em larga escala e ingestão de dados em tempo real.
Machine Learning, IA e Ciência de Dados
- Treine e implante modelos de machine learning usando notebooks com tecnologia Spark.
- Permita a engenharia de recursos e a transformação de dados em larga escala.
- Forneça ambientes de execução gerenciados para cargas de trabalho Python e PySpark.
- Crie agentes de IA de conversação para ajudar na recuperação e desenvolvimento de dados.
Catálogo e Governança de Dados Empresariais, Delta Sharing
- Gerenciamento centralizado de metadados para dados estruturados e não estruturados.
- Controle de acesso baseado em função (RBAC) para acesso e colaboração seguros de dados.
- Integração com catálogos externos, incluindo o Autonomous Database (ADB) e o Object Storage.
- A Oracle AI Data Platform suporta o Delta Sharing, permitindo o compartilhamento de dados seguro, em tempo real e governado entre as fronteiras organizacionais.
Análises, Business Intelligence e Relatórios
- Conecte a OCI Oracle Analytics Cloud (OAC) e ferramentas de BI de terceiros via JDBC como Tableau e Power BI.
Integração de Dados Multinuvem e Híbrida
- Ative a execução de consulta federada em vários serviços do OCI.
- Integre com bancos de dados e armazenamento em nuvem de terceiros para análise híbrida.
- Mantenha a soberania e a conformidade dos dados em vários ambientes.