Sobre o uso do Oracle AI Database 26ai para IA empresarial
- Acelere o tempo de valorização da IA ativando dados existentes residentes na Oracle
- Melhore a qualidade e a consistência das respostas com contexto selecionado e alinhado às políticas
- Escale com confiança no desempenho, na disponibilidade e na segurança de nível empresarial da Oracle
- Reduza a complexidade arquitetônica unificando o armazenamento de dados e o gerenciamento de vetores
Arquitetura
A arquitetura a seguir mostra uma implantação típica de três camadas do Dify no OCI em uma região do OCI e uma única VCN que abrange três domínios de disponibilidade para alta disponibilidade:
oracle-adb-dify-arch-oracle.zip
A lista a seguir resume a implantação e a conectividade:
- Um usuário on-premises se conecta ao aplicativo pela internet.
- As solicitações terminam em um balanceador de carga público fornecido pelo Balanceador de Carga do OCI (LB) em uma VCN.
- Dirija a plataforma com um controlador de entrada e o OCI Load Balancer para acesso externo à console e aos serviços do Dify.
- Os LBs públicos exigem duas sub-redes públicas em diferentes domínios de disponibilidade (AD) para alta disponibilidade (HA).
- Implante o Dify Enterprise Edition no OKE em uma VCN que abrange vários ADs.
- O cluster expõe um ponto final de API (interface de programação de aplicativos) do kubernetes e executa vários nós de trabalho.
- Cada nó hospeda pods de aplicativo. Use sub-rede de pod privado dedicada com gateways NAT para que os pods se conectem à internet sem serem expostos publicamente.
- As imagens de contêiner são extraídas do OCI Container Registry pelo OSN (Oracle Services Network) usando um gateway de serviço.
- Use o Oracle AI Database 26ai como o banco de dados vetorial, aproveitando seu armazenamento/recuperação vetorial nativo e recursos corporativos (particionamento, RAC, sharding, otimização do Exadata) para escala e confiabilidade.
A arquitetura tem os seguintes componentes:
- Região da OCI
Uma região do OCI é uma área geográfica localizada que contém um ou mais data centers, hospedando domínios de disponibilidade. Regiões são independentes de outras regiões, e grandes distâncias podem separá-las (entre países ou mesmo continentes).
- Domínio de disponibilidade
Domínios de disponibilidade são data centers stand-alone e independentes dentro de uma região. Os recursos físicos de cada domínio de disponibilidade são isolados dos recursos de outros domínios de disponibilidade, o que oferece tolerância a falhas. Os domínios de disponibilidade não compartilham infraestrutura como energia ou refrigeração ou a rede interna do domínio de disponibilidade. Portanto, uma falha em um domínio de disponibilidade não deve afetar os outros domínios de disponibilidade na região.
- Rede e sub-rede virtual na nuvem da OCI
VCN (rede virtual na nuvem) é uma rede personalizável definida por software que você configura em uma região do OCI. Assim como as redes tradicionais do data center, as VCNs dão a você controle sobre seu ambiente de rede. Uma VCN pode ter vários blocos de CIDR (Classless Inter-domain Routing) não sobrepostos que você pode alterar após criar a VCN. Você pode segmentar uma VCN em sub-redes, com escopo definido para uma região ou para um domínio de disponibilidade. Cada sub-rede consiste em um intervalo contíguo de endereços que não se sobrepõem a outras sub-redes da VCN. Você pode alterar o tamanho de uma sub-rede após a criação. Uma sub-rede pode ser pública ou privada.
- Balanceador de carga
O Oracle Cloud Infrastructure Load Balancer fornece distribuição automatizada de tráfego de um único ponto de entrada para vários servidores.
- Mecanismo do Kubernetes do OCI
O Oracle Cloud Infrastructure Kubernetes Engine (OCI Kubernetes Engine ou OKE) é um serviço totalmente gerenciado, escalável e altamente disponível que você pode usar para implantar seus aplicativos conteinerizados na nuvem. Você especifica os recursos de computação necessários aos seus aplicativos e o OKE os provisiona no OCI em uma tenancy existente. O OKE usa o Kubernetes para automatizar a implantação, o dimensionamento e o gerenciamento de aplicativos em contêineres em clusters de hosts.
- Oracle AI Database 26ai
O Oracle AI Database 26ai com o AI Vector Search permite consultar dados por significado, em vez de palavras-chave. As representações vetoriais (embeddings) capturam a semântica de texto, imagens, áudio e muito mais para que você possa encontrar conteúdo semelhante de forma eficiente. Funções de distância SQL integradas permitem pesquisas de similaridade usando vetores. Você pode combinar similaridade semântica e outros critérios de pesquisa para fundamentar grandes modelos de linguagem (RAG) para obter respostas mais precisas e relevantes.
- Oracle Autonomous AI Database
O Oracle Autonomous AI Database fornece um banco de Dados fácil de usar e totalmente autônomo (autônomo) que dimensiona de forma elástica e fornece desempenho de consulta rápida. Como serviço, não requer administração de banco de dados. Não é necessário configurar ou gerenciar qualquer hardware ou instalar qualquer software. Ele gerencia automaticamente o provisionamento, o backup, a aplicação de patches e a atualização, o crescimento ou a redução do banco de dados e é um serviço elástico. Desenvolva aplicativos escaláveis com tecnologia de IA com qualquer dado usando recursos de IA integrados. Use sua escolha de modelo de linguagem grande (LLM) e implemente na nuvem ou no seu data center.
Casos de Uso
As enterprises implement AI development plans based on large language models (LLM) models and private data, Oracle AI Database 26ai, with its dual advantages of native vector management and mature enterprise-class features, provides a stable, efficient, and low-threshold data platform solution for the Dify Oracle AI Database Agent development framework and AI applications built on Dify.
- Reutilização de Recursos e Otimização de Custos: As empresas não precisam mais comprar bancos de dados vetoriais dedicados e podem reutilizar totalmente os recursos existentes do Oracle AI Database, reduzindo significativamente os custos de aquisição e manutenção de hardware.
- Escalabilidade de Capacidade: à medida que dados multimodais (como imagens industriais e logs de áudio) se tornam cada vez mais comuns em aplicações corporativas de IA, o Oracle AI Database 26ai pode expandir ainda mais os recursos de recuperação de vetores multimodais, fornecendo suporte de IA mais abrangente para cenários como manufatura inteligente e diagnóstico médico.
- Garantia de Estabilidade: aproveitando os anos de experiência do Oracle AI Database em particionamento, RAC e otimização do Exadata, o Oracle AI Database 26ai pode lidar facilmente com volumes de dados em nível de petabytes e cenários de alta simultaneidade, garantindo uma operação estável 24 horas por dia, 7 dias por semana para aplicações corporativas de IA.
O Oracle AI Database 26ai não é apenas o principal transportador de gerenciamento de dados vetoriais corporativos, mas também a base técnica principal para promover a transformação das empresas do armazenamento de dados para a mineração de valor de IA, fornecendo suporte técnico sólido para atualizações inteligentes empresariais.
Considerações
Ao integrar o Dify com a OCI, considere essas opções.
- Use sub-redes privadas para camadas de aplicativo/dados, NSGs em listas de segurança quando possível.
- Use o OCI Vault para segredos (chaves de API, creds de banco de dados), políticas do IAM menos privilegiadas e OCI Logging, Monitoring e Alarmes para fins de observabilidade.
- Considere vários pools de nós de domínio de disponibilidade e verificações de integridade do balanceador de carga para obter alta disponibilidade e dimensionamento automático.
Sobre Serviços e Atribuições Obrigatórios
Esta solução requer os seguintes serviços e funções:
- Oracle Cloud Infrastructure
- Oracle Autonomous AI Database
- Mecanismo do Kubernetes do OCI
- Difique a Enterprise Edition
Essas são as funções necessárias para cada serviço.
| Nome do Serviço: Função | Necessário para... |
|---|---|
| Dify: Usuário | Crie um usuário Dify identificado pelo tablespace padrão da senha com a cota de usuários unlimited.
|
Dify: DB_DEVELOPER_ROLE |
Permita que os administradores atribuam rapidamente os privilégios de que os desenvolvedores precisam para projetar, criar e implantar aplicativos para o Oracle Database. |
Consulte Produtos, Soluções e Serviços Oracle para obter o que você precisa.
