Implantar Geração Aumentada de Recuperação de IA Generativa Multicloud (RAG)
Use a OCI Generative AI e o Oracle Integration em uma solução multicloud, como o Oracle Cloud Infrastructure e o Microsoft Azure, para consultar dados organizacionais relevantes e usá-los para fornecer respostas altamente contextualizadas.
Em uma arquitetura RAG, o Oracle Integration pode desempenhar o papel de um orquestrador de dados, garantindo que todas as origens de dados relevantes estejam disponíveis para recuperação. Em seguida, os Agentes do Oracle Cloud Infrastructure Generative AI assumem o controle para aproveitar esses dados para fornecer respostas contextualmente ricas.
Os Agentes do OCI GenAI processam esses dados para fornecer uma resposta contextual incorporando os documentos recuperados e aprimorando suas respostas geradas consultando o modelo de linguagem grande (LLM).
Portanto, embora ambos estejam envolvidos no ciclo de vida dos dados, suas funções são distintas, mas complementares na construção de uma arquitetura RAG multicloud.
Essa abordagem RAG multicloud fornece:
- Flexibilidade multicloud: A arquitetura integra várias plataformas de nuvem (OCI e Azure), tornando-a adaptável ao cenário de dados dentro das empresas.
- Conectividade de alto desempenho: o Oracle Interconnect for Microsoft Azure garante transferência de dados rápida, segura e confiável entre ambientes de nuvem.
- Geração dinâmica de conteúdo: O agente extrai as informações mais atuais de fontes diferentes, garantindo que as respostas de LLM sejam precisas e relevantes.
- Pesquisa de documentos incorporada: Ao usar incorporações e pesquisa semântica, os Agentes OCI GenAI podem fornecer insights mais profundos com base no contexto, em vez de apenas correspondências de palavras-chave.
Arquitetura
Essa solução multicloud obtém dados do Microsoft Azure e da Oracle Cloud Infrastructure (OCI), permitindo que os Agentes do Oracle Cloud Infrastructure Generative AI acessem uma gama mais ampla de informações atualizadas.
Os Agentes OCI GenAI e o Oracle Integration suportam juntos serviços de recuperação, aumento e geração (RAG) para fornecer resultados altamente contextualizados.
Os Agentes OCI GenAI se concentram especificamente no uso de IA generativa para responder às consultas do usuário, recuperando informações relevantes de bases de conhecimento ou documentos para gerar respostas. O agente fornece respostas enriquecidas e sensíveis ao contexto, aproveitando técnicas avançadas de IA, incorporações e divisão de documentos para entender e gerar conteúdo relevante:
- Recuperar: Extraia dados relevantes das fontes de conhecimento, geralmente por meio de pesquisa híbrida avançada, combinando pesquisa lexical e semântica.
- Aumento: Use os dados recuperados para fornecer contexto para uma consulta, garantindo que o modelo de IA generativa tenha as informações necessárias.
- Gerar: Use modelos de linguagem grandes (LLMs) para gerar respostas contextuais às perguntas do usuário, geralmente aprimoradas pelos dados recuperados nas etapas anteriores.
O Oracle Integration, por outro lado, fornece serviços de integração que conectam vários aplicativos e sistemas, permitindo a orquestração de fluxos de dados em vários ambientes:
- Recuperar: Facilita a recuperação de dados de diferentes fontes usando agentes de conectividade para estabelecer conexão privada com várias fontes de dados ou serviços (banco de dados, APIs REST, armazenamento em nuvem etc.) no Azure ou em outros hiperescaladores.
- Orquestre/Ajuste: Orquestra fluxos de trabalho e integra dados de várias fontes, aumentando processos enriquecendo dados por meio de transformações pré-configuradas ou dinâmicas.
- Gerenciar Fluxo de Dados: Ao contrário do agente RAG, o Oracle Integration não está focado na geração de respostas a partir de dados, mas em permitir a movimentação e a transformação sem problemas de dados entre sistemas e aplicativos, garantindo que todos os dados relevantes estejam disponíveis para diferentes serviços.
Área Funcional | Agentes GenAI do OCI | Oracle Integration |
---|---|---|
Objetivo | Projetado para fornecer respostas orientadas por IA, recuperando dados, ampliando-os e usando um LLM para gerar respostas. | Projetado para integrar e orquestrar dados em vários aplicativos, fornecendo conectividade de dados perfeita, mas sem os recursos de geração orientados a LLM. |
Manipulação de Dados | Usa dados para gerar respostas de linguagem natural de maneira sensível ao contexto. | Lida com o fluxo de dados entre aplicativos, atuando como uma ponte entre sistemas sem gerar conteúdo da mesma forma que um LLM faz. |
Recursos Generativos | Tem recursos de IA generativa e usa LLMs para gerar respostas de conversação ou outra saída. | Não tem recursos de IA generativa e é usado para conectar, recuperar e transformar dados entre serviços. |
O diagrama a seguir ilustra o fluxo de dados pela arquitetura:
multicloud-genai-rag-process-oracle.zip
- O usuário interage com o Oracle Digital Assistant ou com os Agentes do OCI GenAI, dependendo da implementação, para fornecer consultas e prompts do usuário.
- O Oracle Integration orquestra chamadas entre diferentes componentes: extração de origens de dados, tratamento da ingestão de documentos e aprovação de prompts do usuário downstream.
- Origens de dados incluem:
- O Oracle Interconnect for Microsoft Azure fornece um link de alta largura de banda entre OCI e Azure para repositórios de documentos, Oracle Database@Azure e assim por diante.
- Os repositórios de arquivos locais fornecem arquivos locais ou locais para ingestão.
- Serviços do OCI, como o Oracle Fusion Cloud Enterprise Resource Planning.
- Oracle Database@Azure em uma sub-rede delegada para compartilhamento de dados entre serviços gerenciados pela Oracle no Azure.
- O processo de ingestão, divisão em blocos e incorporação de documentos pode ser implementado de diferentes maneiras:
- O Oracle Integration (usando JavaScript incorporado ou bibliotecas personalizadas) executa o chunking e chama o OCI Generative AI para incorporação.
- O OCI Functions recebe documentos, os divide e chama o OCI Generative AI para incorporações.
- O Oracle Autonomous Database 23ai executa o chunking e a incorporação usando a funcionalidade de vetor.
O resultado padrão é um conjunto de incorporações de texto em bloco e vetoriais totalmente gerenciadas no contexto multicloud.
- Vetores e chunks são armazenados no Oracle Autonomous Database 23ai:
- A abordagem típica é armazenar incorporações no índice vetorial do Oracle Autonomous Database 23ai.
- O próprio texto do bloco também pode ser armazenado diretamente em um CLOB de banco de dados (para recuperação rápida) ou como referências que apontam para o texto do bloco no OCI Object Storage ou no Azure Data Lake.
- O OCI Object Storage pode armazenar os documentos originais, se necessário, mas você não precisa necessariamente manter incorporações lá se estiver consultando o armazenamento de vetores no banco de dados.
- Quando o usuário solicita uma pergunta, os Agentes do OCI GenAI (ou o Assistente Digital) chamam o Oracle Autonomous Database 23ai para executar uma pesquisa de similaridade de vetor usando a incorporação do prompt do usuário para identificar os melhores chunks correspondentes com base nas pontuações de similaridade do vetor.
- A OCI Generative AI gera incorporações para perguntas e partes de documentos e gera respostas usando modelos de LLM, fornecendo respostas contextualmente enriquecidas. A recuperação de partes e a resposta de LLM também dependem da implementação:
- Se o texto do bloco for armazenado no banco de dados, ele poderá ser recuperado diretamente.
- Se apenas as referências forem armazenadas, o sistema extrairá rapidamente o conteúdo do bloco real do OCI Object Storage, do Azure Data Lake ou de outro repositório.
- Em seguida, os chunks relevantes são alimentados ao LLM na OCI Generative AI, juntamente com o prompt original do usuário para produzir uma resposta contextualmente enriquecida.
- A resposta final é retornada pelo Oracle Digital Assistant ou pela interface de Agentes GenAI do OCI, dependendo do front-end ao qual o usuário está conectado.
O diagrama a seguir ilustra a arquitetura:
arquitetura-rag-genai-multicloud-oracle.zip
- Região do Microsoft Azure
Uma região do Azure é uma área geográfica na qual um ou mais data centers físicos do Azure, chamados de zonas de disponibilidade, residem. As regiões são independentes de outras regiões, e grandes distâncias podem separá-las (entre países ou até mesmo continentes).
As regiões do Azure e da OCI são áreas geográficas localizadas. Para o Oracle Database@Azure, uma região do Azure é conectada a uma região da OCI, com zonas de disponibilidade (AZs) no Azure conectadas a domínios de disponibilidade (ADs) na OCI. Os pares de regiões do Azure e OCI são selecionados para minimizar a distância e a latência.
- Zona de disponibilidade do Microsoft Azure
Uma zona de disponibilidade é um data center fisicamente separado dentro de uma região projetada para ser altamente disponível e tolerante a falhas. As zonas de disponibilidade estão próximas o suficiente para ter conexões de baixa latência com outras zonas de disponibilidade.
- Rede Virtual do Microsoft Azure
A Rede Virtual do Microsoft Azure (VNet) é o bloco de construção fundamental para uma rede privada no Azure. O VNet permite que muitos tipos de recursos do Azure, como máquinas virtuais (VM) do Azure, se comuniquem com segurança entre si, com a internet e com redes locais.
- Sub-rede Delegada do Microsoft Azure
A delegação de sub-rede permite injetar um serviço gerenciado, especificamente um serviço de plataforma como serviço (PaaS), diretamente na sua rede virtual. Uma sub-rede delegada pode ser um home de um serviço gerenciado externamente dentro da sua rede virtual para que o serviço externo atue como um recurso de rede virtual, mesmo que seja um serviço PaaS externo.
- Armazenamento do Data Lake do Microsoft Azure
O Data Lake Storage é uma solução de data lake empresarial baseada em nuvem. Ele foi projetado para armazenar grandes quantidades de dados em qualquer formato e facilitar cargas de trabalho analíticas de big data. Use-o para capturar dados de qualquer tipo e velocidade de ingestão em um único local para facilitar o acesso e a análise usando várias estruturas.
- Microsoft Azure Synapse Analytics
O Azure Synapse Analytics combina um serviço centralizado para armazenamento e processamento de dados com uma arquitetura de serviço extensível e vinculado que permite integrar armazenamentos de dados, plataformas de processamento e ferramentas de visualização comumente usados.
O Oracle Cloud Infrastructure fornece os seguintes componentes:
- Região
Região do Oracle Cloud Infrastructure é uma área geográfica localizada que contém um ou mais data centers, denominada domínios de disponibilidade. As regiões são independentes de outras regiões, e grandes distâncias podem separá-las (entre países ou até mesmo continentes).
- Domínio de disponibilidade
Domínios de disponibilidade são data centers stand-alone e independentes dentro de uma região. Os recursos físicos de cada domínio de disponibilidade são isolados dos recursos de outros domínios de disponibilidade, o que oferece tolerância a falhas. Os domínios de disponibilidade não compartilham infraestrutura como energia ou refrigeração ou a rede interna do domínio de disponibilidade. Portanto, uma falha em um domínio de disponibilidade não deve afetar os outros domínios de disponibilidade na região.
- Rede virtual na nuvem (VCN) e sub-redes
Uma VCN é uma rede personalizável definida por software que você configura em uma região do Oracle Cloud Infrastructure. Como as redes tradicionais de data center, as VCNs oferecem controle sobre seu ambiente de rede. Uma VCN pode ter vários blocos CIDR não sobrepostos que você pode alterar após a criação da VCN. Você pode segmentar uma VCN em sub-redes, com escopo definido para uma região ou para um domínio de disponibilidade. Cada sub-rede consiste em um intervalo contíguo de endereços que não se sobrepõem a outras sub-redes da VCN. Você pode alterar o tamanho de uma sub-rede após a criação. Uma sub-rede pode ser pública ou privada.
- Tabela de roteamento
As tabelas de roteamento virtual contêm regras para rotear o tráfego de sub-redes para destinos fora de uma VCN, geralmente por meio de gateways.
- Lista de segurança
Para cada sub-rede, você pode criar regras de segurança que especifiquem a origem, o destino e o tipo de tráfego que deve ser permitido dentro e fora da sub-rede.
- IA Generativa
O Oracle Cloud Infrastructure Generative AI é um serviço da OCI totalmente gerenciado que fornece um conjunto de LLMs (grandes modelos de linguagem) de última geração, personalizáveis e personalizáveis que cobrem uma ampla variedade de casos de uso para geração de texto, resumo, pesquisa semântica e muito mais. Use o playground para experimentar os modelos pré-treinos prontos para usar ou crie e hospede seus próprios modelos personalizados ajustados com base em seus próprios dados em clusters de IA dedicados.
- Integração
O Oracle Integration é um ambiente totalmente gerenciado e pré-configurado que permite integrar aplicativos na nuvem e on-premises, automatizar processos de negócios e desenvolver aplicativos visuais. Ele usa um servidor de arquivos compatível com SFTP para armazenar e recuperar arquivos e permite que você troque documentos com parceiros comerciais business-to-business usando um portfólio de centenas de adaptadores e receitas para se conectar com aplicativos Oracle e de terceiros.
- Armazenamento de objetos
O serviço OCI Object Storage oferece acesso rápido a grandes quantidades de dados estruturados e não estruturados de qualquer tipo de conteúdo, incluindo backups de bancos de dados, dados de análise e conteúdo avançado, como imagens e vídeos. Você pode armazenar dados de forma segura e protegida diretamente da internet ou de dentro da plataforma da nuvem. Você pode dimensionar o armazenamento sem prejudicar o desempenho ou a confiabilidade do serviço.
Use o armazenamento padrão para armazenamento de acesso frequente que você precisa para acessar de forma rápida, imediata e com frequência. Use o armazenamento de arquivos compactados para armazenamento "frio" que você mantém por longos períodos de tempo e raramente acessa.
- Funções
O Oracle Cloud Infrastructure Functions é uma plataforma Functions-as-a-Service (FaaS) totalmente gerenciada, multitenant, altamente escalável e sob demanda. Ele é alimentado pelo mecanismo de código aberto do Fn Project. O OCI Functions permite que você implante seu código e o chame diretamente ou acione-o em resposta a eventos. O OCI Functions usa contêineres do Docker hospedados no Oracle Cloud Infrastructure Registry.
- Analytics
O Oracle Analytics Cloud é um serviço de nuvem pública escalável e seguro que capacita os analistas de negócios com recursos modernos de análise de autoatendimento com tecnologia de IA para preparação de dados, visualização, relatórios corporativos, análise aumentada e processamento e geração de linguagem natural. Com o Oracle Analytics Cloud, você também obtém recursos flexíveis de gerenciamento de serviços, incluindo configuração rápida, dimensionamento e aplicação de patches fáceis e gerenciamento automatizado do ciclo de vida.
- Digital Assistant
O Oracle Digital Assistant é uma plataforma que permite criar e implantar assistentes digitais para seus usuários. Com o Oracle Digital Assistant, você pode criar interfaces orientadas por IA (ou chatbots) para aplicativos de negócios por meio de interfaces de texto, chat e voz. Cada assistente digital tem uma coleção de uma ou mais habilidades especializadas para ajudar os usuários a concluir uma variedade de tarefas em conversas de linguagem natural. Por exemplo, um assistente digital individual pode ter habilidades que se concentram em tipos específicos de tarefas, como rastrear estoque, enviar cartões de ponto e criar relatórios de despesas.
- Autonomous Database
O Oracle Autonomous Database é um ambiente de banco de dados totalmente gerenciado e pré-configurado que você pode usar para cargas de trabalho de processamento de transações e data warehousing. Você não precisa configurar nem gerenciar nenhum hardware, nem instalar nenhum software. O Oracle Cloud Infrastructure trata da criação, backup, aplicação de patches, upgrade e ajuste do banco de dados.
Explorar Mais
Saiba mais sobre os recursos desta arquitetura e sobre arquiteturas relacionadas.
-
RAG para a realidade: Amplifique a IA e reduza os custos (blog)
-
Crie uma pilha de IA generativa de nível empresarial no Oracle Cloud Infrastructure
-
Implemente a geração aumentada de recuperação usando o Oracle Integration
-
Ative integrações multicloud do Oracle Cloud ERP para o Microsoft Azure SQL Database
-
Saiba mais sobre o Oracle Maximum Availability Architecture para Oracle Database@Azure
-
Saiba mais sobre a seleção de topologias de rede para o Oracle Database@Azure
-
Estrutura bem arquitetada para o Oracle Cloud Infrastructure