Modelos e Regiões de IA Generativa para Agentes de IA Corporativa

Os Enterprise AI Agents na OCI Generative AI suportam um subconjunto de modelos e regiões pré-treinados da OCI Generative AI. Esta página lista os modelos e regiões suportados para inferência de tempo de execução e memória de projeto.

Para Chamar Modelos

Para Pontos Finais e Ferramentas Compatíveis com OCI-OpenAI
Observação

Os modelos a seguir são suportados para os Pontos Finais Compatíveis com OpenAI do OCI e Ferramentas Compatíveis com OpenAI.

Modelos de Chat Disponíveis

Os agentes podem chamar os seguintes modelos de chat para casos de uso de inferência agêntica:

Plataforma Google Vertex AI
OpenAI Código Aberto
Plataforma xAI
Importante

Chamadas Externas para Modelos Grok xAI

Os modelos xAI Grok são hospedados em um data center da OCI, em uma tenancy provisionada para xAI. Os modelos xAI Grok, que podem ser acessados por meio do serviço OCI Generative AI, são gerenciados pelo xAI.

Regiões Comerciais Disponíveis (OC1)

Você pode acessar modelos de inferência autêntica em uma ou mais das seguintes regiões OC1:

Nome da Região Local Identificador da Região Chave da Região
Leste do Brasil (São Paulo) São Paulo sa-saopaulo-1 GRU
Centro da Alemanha (Frankfurt) Frankfurt eu-frankfurt-1 FRA
Sul da Índia (Hyderabad) Hyderabad ap-hyderabad-1 HYD
Centro do Japão (Osaka) Osaka ap-osaka-1 KIX
Centro da Arábia Saudita (Riade) Riyadh me-riyadh-1 RUH
Sul do Reino Unido (Londres) London uk-london-1 LHR
Leste dos EUA (Ashburn) Ashburn us-ashburn-1 IAD
Centro-Oeste dos EUA (Chicago) Chicago us-chicago-1 ORD
Oeste dos EUA (Phoenix) Phoenix us-phoenix-1 PHX

Saiba Sobre Regiões e Domínios de Disponibilidade.

Observação

  • Leste dos EAU (Dubai): Os pontos finais e as ferramentas compatíveis com OCI-OpenAI não estão disponíveis nesta região.
  • Disponibilidade: Nem todos os modelos listados estão disponíveis nas regiões listadas anteriores. Para ver as regiões suportadas por modelo e os detalhes da implantação, consulte a página Modelos por Região.
  • Chamadas Externas: Para obter observações sobre modelos com chamadas externas, consulte Chamadas Externas.

Para ativar a memória do projeto

Para Compactação de Memória de Curto Prazo (Histórico de Conversas)

Ao criar um projeto, você pode ativar a compactação de memória de curto prazo para conversas e respostas relacionadas a esse projeto. Consulte a tabela a seguir para obter os modelos e regiões disponíveis para compactação de memória.

Região Código da Região Modelo de Memória de Curto Prazo
Leste do Brasil (São Paulo) sa-saopaulo-1
Centro da Alemanha (Frankfurt) eu-frankfurt-1
Sul do Reino Unido (Londres) uk-london-1
Sul da Índia (Hyderabad) ap-hyderabad-1
Leste dos EUA (Ashburn) (entre regiões para Centro-Oeste dos EUA (Chicago) us-ahsburn-1 (entre regiões para us-chicago-1)
Centro do Japão (Osaka) ap-osaka-1
Centro da Arábia Saudita (Riade) me-riyadh-1
Centro-Oeste dos EUA (Chicago) us-chicago-1
Oeste dos EUA (Phoenix) (entre regiões para Centro-Oeste dos EUA (Chicago) us-phoenix-1(entre regiões para us-chicago-1)

Para extrair informações-chave para memória de longo prazo

chapéu

Ao criar um projeto, você pode ativar a extração de informações de conversas e respostas para um recurso de memória de longo prazo. Você seleciona um modelo de extração que visa extrair informações importantes de conversas. Consulte a tabela a seguir para obter as regiões e o modelo suportados para extrair informações-chave a serem usadas para memória de longo prazo.

Região Modelo de Extração Disponível
Regiões Comerciais Disponíveis (OC1) fazem referência cruzada com regiões que OpenAI gpt-oss-120b está disponível OpenAI gpt-oss-120b
Para armazenar informações-chave como incorporações para memória de longo prazo

Ao criar um projeto, você pode selecionar um modelo de incorporação para armazenar memórias extraídas como vetores pesquisáveis. O modelo de incorporação disponível depende da região do projeto. Consulte a seguinte tabela para obter o modelo de incorporação disponível em cada região:

Região Código da Região Modelo Incorporado Disponível
Leste do Brasil (São Paulo) sa-saopaulo-1 Cohere Embed Multilíngue 3
Centro da Alemanha (Frankfurt) eu-frankfurt-1 Cohere Embed Multilíngue 3
Sul do Reino Unido (Londres) uk-london-1 Cohere Embed Multilíngue 3
Sul da Índia (Hyderabad) ap-hyderabad-1 Cohere Incorporar Imagem Multilíngue 3
Leste dos EUA (Ashburn) (entre regiões para Centro-Oeste dos EUA (Chicago) us-ahsburn-1 Cohere Embed 4
Centro do Japão (Osaka) ap-osaka-1 Cohere Embed 4
Centro da Arábia Saudita (Riade) me-riyadh-1 Cohere Embed 4
Centro-Oeste dos EUA (Chicago) us-chicago-1 Cohere Embed 4
Oeste dos EUA (Phoenix) (entre regiões para Centro-Oeste dos EUA (Chicago) us-phoenix-1 Cohere Embed 4

Chamadas Externas

Chamadas Externas para Modelos Grok xAI

Importante

Chamadas Externas para Modelos Grok xAI

Os modelos xAI Grok são hospedados em um data center da OCI, em uma tenancy provisionada para xAI. Os modelos xAI Grok, que podem ser acessados por meio do serviço OCI Generative AI, são gerenciados pelo xAI.

Chamadas Externas para Modelos do Google

Importante

Chamadas Externas para Google Gemini 2.5 Pro em Regiões dos EUA

O modelo Google Gemini 2.5 Pro que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Google Gemini 2.5 Pro (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Google Gemini 2.5 Pro, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.

Importante

Chamadas Externas para Gemini 2.5 Flash em Regiões dos EUA

O modelo Gemini 2.5 Flash que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Gemini 2.5 Flash (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Flash, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.

Importante

Chamadas Externas para Gemini 2.5 Flash-Lite em Regiões dos EUA

O modelo Gemini 2.5 Flash-Lite que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Gemini 2.5 Flash-Lite (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Flash-Lite, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.