Modelos e Regiões de IA Generativa para Agentes de IA Corporativa
Os Enterprise AI Agents na OCI Generative AI suportam um subconjunto de modelos e regiões pré-treinados da OCI Generative AI. Esta página lista os modelos e regiões suportados para inferência de tempo de execução e memória de projeto.
Para Chamar Modelos
Os modelos a seguir são suportados para os Pontos Finais Compatíveis com OpenAI do OCI e Ferramentas Compatíveis com OpenAI.
Modelos de Chat Disponíveis
Os agentes podem chamar os seguintes modelos de chat para casos de uso de inferência agêntica:
- Plataforma Google Vertex AI
- OpenAI Código Aberto
- Plataforma xAI
Chamadas Externas para Modelos Grok xAI
Os modelos xAI Grok são hospedados em um data center da OCI, em uma tenancy provisionada para xAI. Os modelos xAI Grok, que podem ser acessados por meio do serviço OCI Generative AI, são gerenciados pelo xAI.
Regiões Comerciais Disponíveis (OC1)
Você pode acessar modelos de inferência autêntica em uma ou mais das seguintes regiões OC1:
| Nome da Região | Local | Identificador da Região | Chave da Região |
|---|---|---|---|
| Leste do Brasil (São Paulo) | São Paulo |
sa-saopaulo-1
|
GRU
|
| Centro da Alemanha (Frankfurt) | Frankfurt |
eu-frankfurt-1
|
FRA
|
| Sul da Índia (Hyderabad) | Hyderabad |
ap-hyderabad-1
|
HYD
|
| Centro do Japão (Osaka) | Osaka |
ap-osaka-1
|
KIX
|
| Centro da Arábia Saudita (Riade) | Riyadh |
me-riyadh-1
|
RUH
|
| Sul do Reino Unido (Londres) | London |
uk-london-1
|
LHR
|
| Leste dos EUA (Ashburn) | Ashburn |
us-ashburn-1
|
IAD
|
| Centro-Oeste dos EUA (Chicago) | Chicago |
us-chicago-1
|
ORD
|
| Oeste dos EUA (Phoenix) | Phoenix |
us-phoenix-1
|
PHX
|
Saiba Sobre Regiões e Domínios de Disponibilidade.
- Leste dos EAU (Dubai): Os pontos finais e as ferramentas compatíveis com OCI-OpenAI não estão disponíveis nesta região.
- Disponibilidade: Nem todos os modelos listados estão disponíveis nas regiões listadas anteriores. Para ver as regiões suportadas por modelo e os detalhes da implantação, consulte a página Modelos por Região.
- Chamadas Externas: Para obter observações sobre modelos com chamadas externas, consulte Chamadas Externas.
Para ativar a memória do projeto
Ao criar um projeto, você pode ativar a compactação de memória de curto prazo para conversas e respostas relacionadas a esse projeto. Consulte a tabela a seguir para obter os modelos e regiões disponíveis para compactação de memória.
| Região | Código da Região | Modelo de Memória de Curto Prazo |
|---|---|---|
| Leste do Brasil (São Paulo) | sa-saopaulo-1 |
|
| Centro da Alemanha (Frankfurt) | eu-frankfurt-1 |
|
| Sul do Reino Unido (Londres) | uk-london-1 |
|
| Sul da Índia (Hyderabad) | ap-hyderabad-1 |
|
| Leste dos EUA (Ashburn) (entre regiões para Centro-Oeste dos EUA (Chicago) | us-ahsburn-1 (entre regiões para us-chicago-1) |
|
| Centro do Japão (Osaka) | ap-osaka-1 |
|
| Centro da Arábia Saudita (Riade) | me-riyadh-1 |
|
| Centro-Oeste dos EUA (Chicago) | us-chicago-1 |
|
| Oeste dos EUA (Phoenix) (entre regiões para Centro-Oeste dos EUA (Chicago) | us-phoenix-1(entre regiões para us-chicago-1) |
Para extrair informações-chave para memória de longo prazo
chapéu
Ao criar um projeto, você pode ativar a extração de informações de conversas e respostas para um recurso de memória de longo prazo. Você seleciona um modelo de extração que visa extrair informações importantes de conversas. Consulte a tabela a seguir para obter as regiões e o modelo suportados para extrair informações-chave a serem usadas para memória de longo prazo.
| Região | Modelo de Extração Disponível |
|---|---|
| Regiões Comerciais Disponíveis (OC1) fazem referência cruzada com regiões que OpenAI gpt-oss-120b está disponível | OpenAI gpt-oss-120b |
Ao criar um projeto, você pode selecionar um modelo de incorporação para armazenar memórias extraídas como vetores pesquisáveis. O modelo de incorporação disponível depende da região do projeto. Consulte a seguinte tabela para obter o modelo de incorporação disponível em cada região:
| Região | Código da Região | Modelo Incorporado Disponível |
|---|---|---|
| Leste do Brasil (São Paulo) | sa-saopaulo-1 |
Cohere Embed Multilíngue 3 |
| Centro da Alemanha (Frankfurt) | eu-frankfurt-1 |
Cohere Embed Multilíngue 3 |
| Sul do Reino Unido (Londres) | uk-london-1 |
Cohere Embed Multilíngue 3 |
| Sul da Índia (Hyderabad) | ap-hyderabad-1 |
Cohere Incorporar Imagem Multilíngue 3 |
| Leste dos EUA (Ashburn) (entre regiões para Centro-Oeste dos EUA (Chicago) | us-ahsburn-1 |
Cohere Embed 4 |
| Centro do Japão (Osaka) | ap-osaka-1 |
Cohere Embed 4 |
| Centro da Arábia Saudita (Riade) | me-riyadh-1 |
Cohere Embed 4 |
| Centro-Oeste dos EUA (Chicago) | us-chicago-1 |
Cohere Embed 4 |
| Oeste dos EUA (Phoenix) (entre regiões para Centro-Oeste dos EUA (Chicago) | us-phoenix-1
|
Cohere Embed 4 |
Chamadas Externas
Chamadas Externas para Modelos Grok xAI
Chamadas Externas para Modelos Grok xAI
Os modelos xAI Grok são hospedados em um data center da OCI, em uma tenancy provisionada para xAI. Os modelos xAI Grok, que podem ser acessados por meio do serviço OCI Generative AI, são gerenciados pelo xAI.
Chamadas Externas para Modelos do Google
Chamadas Externas para Google Gemini 2.5 Pro em Regiões dos EUA
O modelo Google Gemini 2.5 Pro que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Google Gemini 2.5 Pro (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Google Gemini 2.5 Pro, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.
Chamadas Externas para Gemini 2.5 Flash em Regiões dos EUA
O modelo Gemini 2.5 Flash que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Gemini 2.5 Flash (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Flash, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.
Chamadas Externas para Gemini 2.5 Flash-Lite em Regiões dos EUA
O modelo Gemini 2.5 Flash-Lite que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Gemini 2.5 Flash-Lite (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Flash-Lite, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.