Agentes de IA empresarial na OCI Generative AI
A OCI Generative AI fornece duas abordagens principais para criar agentes de nível empresarial e você também pode combiná-los em uma arquitetura híbrida.
As duas abordagens são:
- Crie agentes com a API de Respostas do OCI
- Implemente aplicativos agênticos hospedados no OCI Generative AI
Essas opções permitem que você comece com uma abordagem simples que prioriza a API, passe para implantações hospedadas quando precisar delas ou combine as duas na mesma arquitetura.
Abordagem 1: Criar Agentes com a API de Respostas da OCI
Use a API de Respostas da OCI quando quiser uma maneira flexível e que priorize a API para criar agentes sem gerenciar você mesmo a infraestrutura.
A API de Respostas da OCI é a principal API para fluxos de trabalho agênticos na OCI Generative AI. É compatível com OpenAI, o que significa que você usa a mesma sintaxe de solicitação e padrões de solicitação da API de respostas OpenAI. No entanto, o URL base aponta para a OCI Generative AI, a autenticação usa credenciais da OCI Generative AI e as solicitações são processadas por meio da OCI Generative AI nas regiões da OCI.
Essa abordagem é útil quando você deseja criar agentes rapidamente, mantendo a execução do modelo, o uso de ferramentas e os serviços de suporte gerenciados pela OCI.
O que a API de Respostas suporta
Com a API de Respostas do OCI, você pode:
- Selecione entre os modelos suportados oferecidos pelo OCI nas regiões suportadas do OCI.
- Use um formato de API compatível com OpenAI com autenticação OCI e execução gerenciada pela OCI.
- Crie workflows de agente de etapa única ou de várias etapas.
- Adicione o contexto da conversa para interações de vários turnos.
- Use ferramentas suportadas pela API de Respostas, como Pesquisa de Arquivos, Intérprete de Código, Chamada de Função e Chamada MCP.
- Integre a API básica, como Arquivos, Armazenamentos de Vetores e Contêineres, ao mesmo fluxo de trabalho.
Conversas e memória
A API de Respostas funciona com a API de Conversas para que você possa manter o contexto entre turnos em uma conversa de vários turnos.
A OCI Generative AI também fornece um recurso chamado projects. Um projeto agrupa recursos do agente relacionados, como respostas, conversas, arquivos, contêineres e configurações de memória.
Em um projeto, você pode configurar o comportamento da memória, incluindo:
- Memória de longo prazo para contexto persistente em interações relacionadas no mesmo projeto
- Memória de curto prazo para contexto transmitido em uma conversa em andamento
Isso permite organizar fluxos de trabalho de agentes relacionados e gerenciar o contexto retido de forma controlada.
Ferramentas com a API de Respostas
O suporte a ferramentas faz parte da API de Respostas. Quando você envia uma solicitação de API de Respostas, pode incluir definições de ferramentas suportadas diretamente na solicitação.
O OCI Generative AI suporta as seguintes ferramentas de API de Respostas:
- Pesquisa de Arquivo
- Interpretador de códigos
- Função de chamada
- Chamada MCP
Essas ferramentas expandem o que o modelo pode fazer durante um fluxo de trabalho. À medida que a OCI Generative AI expande o suporte para mais ferramentas de API de Respostas, esse conjunto pode crescer.
API Básica com a API de Respostas
Se um fluxo de trabalho precisar de blocos de construção de nível inferior, você poderá usar a API básica junto com a API de Respostas.
Essas APIs básicas incluem:
- Arquivos
- Armazenamentos de Vetores
- Contêineres
Essas APIs também são compatíveis com OpenAI e funcionam perfeitamente com a API de Respostas. Você pode usá-los para oferecer suporte a necessidades de recuperação, tratamento de documentos, execução em sandbox e outras necessidades de workflow do agente.
Pesquisa SQL (NL2SQL)
A OCI Generative AI também fornece fluxos de trabalho de Pesquisa SQL (NL2SQL) para o Enterprise AI Agent. O NL2SQL converte solicitações de linguagem natural em SQL validado para dados corporativos federados sem mover ou copiar os dados subjacentes. Os dados de origem devem ser armazenados no Oracle Autonomous Database. O NL2SQL usa uma camada de enriquecimento semântico para mapear termos de negócios para tabelas de banco de dados, colunas e junções.
O NL2SQL gera somente SQL e não executa a consulta. Para usá-lo, crie um Armazenamento Semântico com suporte de um armazenamento de vetores de dados estruturados, configure as conexões necessárias, execute o enriquecimento e chame a API GenerateSqlFromNl. A execução da consulta é tratada separadamente por meio do Servidor DBTools MCP, que autoriza e executa a consulta no banco de dados de origem usando as permissões e os guardrails existentes.
Por que usar essa abordagem
Use a abordagem da API de Respostas quando quiser:
- Um início rápido para a criação de agentes
- Execução gerenciada pela OCI sem gerenciar a infraestrutura
- Sintaxe de solicitação compatível com OpenAI
- Suporte flexível para modelos, conversas, ferramentas e APIs fundamentais
- Uma arquitetura que prioriza a API e pode crescer com seu aplicativo
- Acesso a outros recursos do agente do OCI, como NL2SQL para workflows de dados empresariais
Em suma, essa abordagem oferece uma maneira rápida e flexível de criar agentes, enquanto a OCI Generative AI gerencia o ambiente de execução subjacente.
Abordagem 2: Implantar Aplicativos Agênticos Hospedados
Use aplicativos hospedados quando quiser empacotar e implantar seu próprio runtime de agente no OCI Generative AI.
Nessa abordagem, a OCI Generative AI fornece um modelo de hospedagem gerenciada criado em torno de dois recursos:
- Aplicativos
- Implantações
Um aplicativo define a configuração do aplicativo hospedado. Uma implantação executa uma imagem de contêiner específica para esse aplicativo.
Essa abordagem é útil quando você já tem um aplicativo agentic que deseja empacotar, implantar e executar na infraestrutura gerenciada pelo OCI.
O que você configura em um aplicativo
Ao criar um aplicativo, você define a configuração de hospedagem básica para o aplicativo agentic.
Isso inclui configurações como:
- Comportamento de dimensionamento de implantação para lidar com a carga
- Se o aplicativo usa armazenamento gerenciado
- Qual serviço de armazenamento gerenciado o aplicativo usa:
- OCI PostgreSQL
- Cache do OCI
- Oracle Autonomous Database
- A VCN e a sub-rede do aplicativo
- Se o aplicativo usa pontos finais públicos ou privados
- A configuração do domínio de identidades do OCI IAM para o aplicativo
Integração de aplicativos do OCI IAM
Como parte do modelo de aplicativo hospedado, você designa um aplicativo em um domínio de identidades do OCI.
Este aplicativo do domínio de identidades do OCI é um aplicativo personalizado registrado no Oracle Cloud Infrastructure Identity and Access Management (OCI IAM). Ele controla o acesso do usuário e suporta integração segura, sign-on único (SSO) e propagação de identidade usando protocolos OAuth.
Como as implantações funcionam
Depois de criar o aplicativo, crie uma implantação dentro desse aplicativo.
Uma implantação usa a configuração definida pelo aplicativo e aponta para uma imagem de contêiner específica que você cria e envia para o OCI Container Registry.
O fluxo típico é:
- Crie sua imagem de contêiner
- Envie a imagem ao OCI Container Registry
- Crie um aplicativo no OCI Generative AI
- Criar uma implantação nesse aplicativo
- Aponte a implantação para a imagem do contêiner
- Execute a implantação e torne-a ativa
A implantação ativa atende a solicitações por meio do ponto final do aplicativo.
Por que usar essa abordagem
Use aplicativos hospedados quando quiser:
- Para executar seu próprio runtime de agente empacotado no OCI
- Infraestrutura gerenciada pela OCI para hospedagem e dimensionamento
- Integração de rede, armazenamento e identidade gerenciados
- Um modelo de implantação criado com base em imagens de contêiner e OCI Container Registry
- Uma opção de hospedagem de produção para aplicativos agentic
Essa abordagem foi projetada para hospedar aplicativos agênticos em infraestrutura gerenciada pela OCI com suporte integrado para implantação e dimensionamento automático.
Abordagem híbrida
Como ambas as abordagens estão disponíveis, você também pode usar uma abordagem híbrida.
Em uma arquitetura híbrida, você usa a API de Respostas para orquestração de modelos, conversas, ferramentas, APIs básicas e recursos de suporte, como NL2SQL, além de usar implantações hospedadas para tempos de execução de agentes personalizados que você empacota e opera na OCI.
Por exemplo, você pode:
- Chamar a API de Respostas do OCI para interação de modelo e uso de ferramentas
- Usar API de Conversas e memória baseada em projeto para tratamento de contexto
- Usar arquivos, armazenamentos de vetores e contêineres como parte do fluxo de trabalho
- Usar NL2SQL para geração de linguagem natural para SQL em dados empresariais federados
- Implantar um runtime de agente personalizado como um aplicativo hospedado
Isso permite combinar recursos de agente gerenciados pelo OCI com componentes de aplicativo empacotados que você deseja executar no OCI.
Decida qual abordagem se encaixa no seu caso de uso
Use a abordagem API de Respostas quando quiser a maneira mais rápida e flexível de criar agentes com execução de modelo gerenciada pela OCI, conversas, ferramentas, APIs fundamentais e recursos de suporte, como NL2SQL.
Use aplicativos hospedados quando quiser empacotar e implantar seu próprio runtime de agente e executá-lo na infraestrutura gerenciada pela OCI.
Use uma abordagem híbrida quando sua arquitetura se beneficiar de ambos os modelos.
Diagrama
O diagrama mostra como essas peças se encaixam. De um lado está o aplicativo cliente ou agente, incluindo SDK, frameworks, prompts, configurações do modelo e ferramentas locais. No meio estão a API e os recursos gerenciados da OCI, incluindo a API de Respostas da OCI, memória, Arquivos, Lojas de Vetores, Contêineres e recursos de ferramentas relacionados. Por outro lado, há o tempo de execução e a infraestrutura gerenciados pela OCI usados para executar modelos, ferramentas e cargas de trabalho hospedadas, ao mesmo tempo em que se integra aos serviços da OCI e sistemas de terceiros.
