Modelos e Regiões de IA Generativa para API Agentic
Esta página lista o subconjunto de modelos e regiões pré-treinados suportados para recursos autênticos no OCI Generative AI.
Os recursos agênticos incluem:
- Inferência autêntica (chamadas de chat de runtime) usada pelos agentes durante o runtime.
- Modelos de memória do projeto usados quando você adiciona extração de memória de longo prazo e compactação de memória de curto prazo a um projeto da OCI Generative AI.
1. Modelos de Inferência Agêntica (Runtime)
Modelos de Chat Disponíveis para Agentes
Os agentes podem chamar os seguintes modelos de chat para casos de uso de inferência agêntica:
- Plataforma Google Vertex AI
- OpenAI Código Aberto
- Plataforma xAI
Regiões Disponíveis
Você pode acessar modelos de inferência agênticos em uma ou mais das seguintes regiões OC1:
- América do Norte
-
- Leste dos EUA (Ashburn)
- Centro-Oeste dos EUA (Chicago)
- Oeste dos EUA (Phoenix)
- América Do Sul
-
- Leste do Brasil (São Paulo)
- Europa (UE)
-
- Centro da Alemanha (Frankfurt)
- Sul do Reino Unido (Londres)
- Oriente Médio (ME)
-
- Centro da Arábia Saudita (Riade)
-
Observação
A API Agentic não está disponível no Leste dos Emirados Árabes Unidos (Dubai).
- Ásia-Pacífico (AP)
-
- Sul da Índia (Hyderabad)
- Centro do Japão (Osaka)
Nem todos os modelos estão disponíveis em todas as regiões da lista anterior. Para ver as regiões suportadas por modelo e os detalhes da implantação, consulte a página Modelos por Região.
Modelos de Memória do Projeto (Definições do Projeto)
Ao criar um Projeto e ativar recursos de memória, você seleciona modelos para:
- Compactação de memória de curto prazo (compactação de histórico de conversações)
- Extração de memória de longo prazo (destina-se a extrair informações importantes de conversas)
- Incorporações de memória de longo prazo (armazena memórias extraídas como vetores pesquisáveis)
2.1 Compactação de Memória de Curto Prazo (Compactação de Histórico de Conversas)
Os projetos podem usar os seguintes modelos para compactação de memória de curto prazo:
| Região | Código da Região | Incorporar Modelo |
|---|---|---|
| Leste do Brasil (São Paulo) | sa-saopaulo-1 |
|
| Centro da Alemanha (Frankfurt) | eu-frankfurt-1 |
|
| Sul do Reino Unido (Londres) | uk-london-1 |
|
| Sul da Índia (Hyderabad) | ap-hyderabad-1 |
|
| Leste dos EUA (Ashburn) (entre regiões para Centro-Oeste dos EUA (Chicago) | us-ahsburn-1 (entre regiões para us-chicago-1) |
|
| Centro do Japão (Osaka) | ap-osaka-1 |
|
| Centro da Arábia Saudita (Riade) | me-riyadh-1 |
|
| Centro-Oeste dos EUA (Chicago) | us-chicago-1 |
|
| Oeste dos EUA (Phoenix) (entre regiões para Centro-Oeste dos EUA (Chicago) | us-phoenix-1(entre regiões para us-chicago-1) |
|
2.2 Memória de longo prazo
- Modelo de Extração (Todas as Regiões Suportadas)
- OpenAI gpt-oss-120b
- Modelo de Incorporação
-
O modelo de incorporação usado para armazenar memórias extraídas como vetores pesquisáveis depende da região Projeto:
Região Código da Região Incorporar Modelo Leste do Brasil (São Paulo) sa-saopaulo-1Cohere Embed Multilíngue 3 Centro da Alemanha (Frankfurt) eu-frankfurt-1Cohere Embed Multilíngue 3 Sul do Reino Unido (Londres) uk-london-1Cohere Embed Multilíngue 3 Sul da Índia (Hyderabad) ap-hyderabad-1Cohere Incorporar Imagem Multilíngue 3 Leste dos EUA (Ashburn) (entre regiões para Centro-Oeste dos EUA (Chicago) Consulte chamadas externas
us-ahsburn-1(entre regiões paraus-chicago-1)Cohere Embed 4 Centro do Japão (Osaka) ap-osaka-1Cohere Embed 4 Centro da Arábia Saudita (Riade) me-riyadh-1Cohere Embed 4 Centro-Oeste dos EUA (Chicago) us-chicago-1Cohere Embed 4 Oeste dos EUA (Phoenix) (entre regiões para Centro-Oeste dos EUA (Chicago) Consulte chamadas externas
us-phoenix-1(entre regiões paraus-chicago-1)Cohere Embed 4
Notas e limitações conhecidas
- Leste dos EAU (Dubai): A API Agentic não está disponível nesta região.
- Disponibilidade: As regiões listadas para modelos de inferência de agentic nesta página indicam onde os recursos de agentic são suportados. A disponibilidade do modelo individual ainda pode variar nessas regiões.
Chamadas Externas para Modelos do Google
Chamadas Externas para Google Gemini 2.5 Pro em Regiões dos EUA
O modelo Google Gemini 2.5 Pro que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Google Gemini 2.5 Pro (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Google Gemini 2.5 Pro, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.
Chamadas Externas para Gemini 2.5 Flash em Regiões dos EUA
O modelo Gemini 2.5 Flash que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Gemini 2.5 Flash (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Flash, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.
Chamadas Externas para Gemini 2.5 Flash-Lite em Regiões dos EUA
O modelo Gemini 2.5 Flash-Lite que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Gemini 2.5 Flash-Lite (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Flash-Lite, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.