Modelos e Regiões de IA Generativa para API Agentic

Esta página lista o subconjunto de modelos e regiões pré-treinados suportados para recursos autênticos no OCI Generative AI.

Os recursos agênticos incluem:

  • Inferência autêntica (chamadas de chat de runtime) usada pelos agentes durante o runtime.
  • Modelos de memória do projeto usados quando você adiciona extração de memória de longo prazo e compactação de memória de curto prazo a um projeto da OCI Generative AI.

1. Modelos de Inferência Agêntica (Runtime)

Regiões Disponíveis

Você pode acessar modelos de inferência agênticos em uma ou mais das seguintes regiões OC1:

América do Norte
  • Leste dos EUA (Ashburn)
  • Centro-Oeste dos EUA (Chicago)
  • Oeste dos EUA (Phoenix)
América Do Sul
  • Leste do Brasil (São Paulo)
Europa (UE)
  • Centro da Alemanha (Frankfurt)
  • Sul do Reino Unido (Londres)
Oriente Médio (ME)
  • Centro da Arábia Saudita (Riade)
  • Observação

    A API Agentic não está disponível no Leste dos Emirados Árabes Unidos (Dubai).
Ásia-Pacífico (AP)
  • Sul da Índia (Hyderabad)
  • Centro do Japão (Osaka)
Importante

Nem todos os modelos estão disponíveis em todas as regiões da lista anterior. Para ver as regiões suportadas por modelo e os detalhes da implantação, consulte a página Modelos por Região.

Modelos de Memória do Projeto (Definições do Projeto)

Ao criar um Projeto e ativar recursos de memória, você seleciona modelos para:

  • Compactação de memória de curto prazo (compactação de histórico de conversações)
  • Extração de memória de longo prazo (destina-se a extrair informações importantes de conversas)
  • Incorporações de memória de longo prazo (armazena memórias extraídas como vetores pesquisáveis)

2.1 Compactação de Memória de Curto Prazo (Compactação de Histórico de Conversas)

Os projetos podem usar os seguintes modelos para compactação de memória de curto prazo:

Região Código da Região Incorporar Modelo
Leste do Brasil (São Paulo) sa-saopaulo-1
Meta
OpenAI Código Aberto
Centro da Alemanha (Frankfurt) eu-frankfurt-1
Plataforma Google Vertex AI
Meta
OpenAI Código Aberto
Sul do Reino Unido (Londres) uk-london-1
Plataforma Google Vertex AI
Meta
OpenAI Código Aberto
Sul da Índia (Hyderabad) ap-hyderabad-1
Plataforma Google Vertex AI
Meta
OpenAI Código Aberto
Leste dos EUA (Ashburn) (entre regiões para Centro-Oeste dos EUA (Chicago) us-ahsburn-1 (entre regiões para us-chicago-1)
Plataforma Google Vertex AI
Meta
OpenAI Código Aberto
Centro do Japão (Osaka) ap-osaka-1
Plataforma Google Vertex AI
Meta
OpenAI Código Aberto
Centro da Arábia Saudita (Riade) me-riyadh-1
Meta
OpenAI Código Aberto
Centro-Oeste dos EUA (Chicago) us-chicago-1
Plataforma Google Vertex AI
Meta
OpenAI Código Aberto
Oeste dos EUA (Phoenix) (entre regiões para Centro-Oeste dos EUA (Chicago) us-phoenix-1(entre regiões para us-chicago-1)
Plataforma Google Vertex AI
Meta
OpenAI Código Aberto

2.2 Memória de longo prazo

Modelo de Extração (Todas as Regiões Suportadas)
OpenAI gpt-oss-120b
Modelo de Incorporação

O modelo de incorporação usado para armazenar memórias extraídas como vetores pesquisáveis depende da região Projeto:

Região Código da Região Incorporar Modelo
Leste do Brasil (São Paulo) sa-saopaulo-1 Cohere Embed Multilíngue 3
Centro da Alemanha (Frankfurt) eu-frankfurt-1 Cohere Embed Multilíngue 3
Sul do Reino Unido (Londres) uk-london-1 Cohere Embed Multilíngue 3
Sul da Índia (Hyderabad) ap-hyderabad-1 Cohere Incorporar Imagem Multilíngue 3
Leste dos EUA (Ashburn) (entre regiões para Centro-Oeste dos EUA (Chicago)

Consulte chamadas externas

us-ahsburn-1 (entre regiões para us-chicago-1) Cohere Embed 4
Centro do Japão (Osaka) ap-osaka-1 Cohere Embed 4
Centro da Arábia Saudita (Riade) me-riyadh-1 Cohere Embed 4
Centro-Oeste dos EUA (Chicago) us-chicago-1 Cohere Embed 4
Oeste dos EUA (Phoenix) (entre regiões para Centro-Oeste dos EUA (Chicago)

Consulte chamadas externas

us-phoenix-1 (entre regiões para us-chicago-1) Cohere Embed 4

Notas e limitações conhecidas

  • Leste dos EAU (Dubai): A API Agentic não está disponível nesta região.
  • Disponibilidade: As regiões listadas para modelos de inferência de agentic nesta página indicam onde os recursos de agentic são suportados. A disponibilidade do modelo individual ainda pode variar nessas regiões.

Chamadas Externas para Modelos do Google

Importante

Chamadas Externas para Google Gemini 2.5 Pro em Regiões dos EUA

O modelo Google Gemini 2.5 Pro que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Google Gemini 2.5 Pro (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Google Gemini 2.5 Pro, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.

Importante

Chamadas Externas para Gemini 2.5 Flash em Regiões dos EUA

O modelo Gemini 2.5 Flash que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Gemini 2.5 Flash (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Flash, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.

Importante

Chamadas Externas para Gemini 2.5 Flash-Lite em Regiões dos EUA

O modelo Gemini 2.5 Flash-Lite que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Gemini 2.5 Flash-Lite (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Flash-Lite, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.