Visão Geral da OCI Generative AI

A OCI Generative AI é um serviço da Oracle Cloud Infrastructure totalmente gerenciado para criar, implementar e operar aplicações de IA generativa em escala empresarial.

Use a OCI Generative AI para trabalhar com modelos pré-treinados e personalizados, criar agentes de nível de produção e aplicar controles de governança corporativa em acesso, rede e comportamento de IA. O serviço suporta as principais tarefas de IA generativa, como chat, incorporações, reclassificação e APIs compatíveis com OpenAI, além de fornecer recursos empresariais para ferramentas, memória, recuperação e aplicativos agênticos hospedados.

Esta documentação está organizada em torno de três áreas principais:

  • Modelos de IA corporativos
  • Agentes de IA corporativos
  • Governança de IA empresarial

Modelos de IA corporativos

Use Modelos de IA Corporativos quando quiser acesso ao modelo para tarefas de inferência, como geração de conversação, pesquisa semântica, recomendação, classificação, clustering e classificação de relevância.

A OCI Generative AI suporta:

  • Chat para experiências de conversação, como respostas a perguntas e assistentes virtuais
  • Incorporações para pesquisa semântica, recomendação, classificação e clusterização
  • Classificar novamente para pedidos de documentos por relevância para uma consulta
  • APIs compatíveis com OpenAI para integração com ferramentas e SDKs existentes

Você pode usar modelos da OCI Generative AI de várias maneiras. Você pode chamar modelos hospedados pré-treinados por meio da Console, API ou CLI. Você também pode importar, ajustar e hospedar modelos personalizados em clusters de IA dedicados. Isso oferece um caminho desde a experimentação até a produção com controles corporativos e flexibilidade de implantação.

Agentes de IA corporativos

Use os Enterprise AI Agents quando quiser criar aplicativos agênticos de nível de produção que combinem modelos com ferramentas, memória, recuperação e orquestração.

A OCI Generative AI fornece duas abordagens principais para a criação de agentes:

  • Crie agentes com a API de Respostas do OCI
  • Implemente aplicativos agênticos hospedados no OCI Generative AI

Você também pode combinar essas abordagens em uma arquitetura híbrida.

A API de Respostas do OCI é a principal API para workflows agênticos. É compatível com OpenAI e suporta interação de modelo, orquestração, raciocínio, estado da conversa e uso de ferramentas. As ferramentas suportadas incluem Pesquisa de Arquivo, Interpretador de Código, Chamada de Função e Chamada MCP. Os agentes também podem usar recursos de suporte como Arquivos, Lojas de Vetor, Contêineres, Conversas, Projetos e recursos de memória, como memória de longo prazo e compactação de memória de curto prazo.

A OCI Generative AI também oferece suporte ao SQL Search (NL2SQL) para workflows do agente que precisam de acesso estruturado a dados empresariais. O NL2SQL converte solicitações de linguagem natural em SQL validado usando enriquecimento semântico e metadados de dados estruturados.

Para equipes que desejam hospedagem gerenciada pela OCI para tempos de execução personalizados, a OCI Generative AI fornece Aplicativos e Implantações para aplicativos agênticos hospedados. Esse modelo suporta implantação baseada em contêiner, infraestrutura gerenciada, rede, integração de armazenamento e configuração de identidade.

Governança de IA empresarial

Use o Enterprise AI Governance quando precisar proteger e controlar como os recursos de IA generativa são acessados, implantados e usados.

A governança de IA empresarial na OCI Generative AI combina controles de infraestrutura, identidade, segurança de rede e tempo de execução para ajudar a manter os sistemas de IA seguros, em conformidade e alinhados com a política organizacional.

Os principais recursos de governança incluem:

  • Políticas do IAM para controlar quem pode acessar, usar e gerenciar recursos do OCI Generative AI
  • Pontos Finais Privados para manter o acesso ao modelo dentro de um limite de rede segura
  • Chaves de API para acessar serviços do OCI Generative AI
  • OAuth para tarefas ágeis que exigem integração de aplicativos de domínio de identidade do OCI IAM
  • ZPR (Zero Trust Packet Routing) para aplicação de rede baseada em identidade
  • Guardas para aplicar controles de segurança e conformidade de runtime a entradas e saídas de modelos

Juntos, esses recursos fornecem governança de ponta a ponta em controle de acesso, segurança de rede, configuração de aplicativos hospedados e comportamento de IA.

Como essas áreas funcionam juntas

Essas três áreas trabalham juntas como parte de uma plataforma:

  • Modelos de IA empresariais fornecem a base do modelo para inferência e geração
  • Enterprise AI Agents adicionam orquestração, ferramentas, memória, recuperação e execução hospedada
  • O Enterprise AI Governance aplica os controles de segurança, acesso e conformidade necessários para uso empresarial

Essa combinação permite que você passe do acesso ao modelo para o desenvolvimento ágil de aplicativos e a implantação de produção com governança incorporada.