Modelos y regiones de IA generativa para la API de Agentic
Esta página muestra el subjuego de modelos y regiones previamente entrenados soportado para funciones de autenticación en OCI Generative AI.
Las funciones de Agentic incluyen:
- Inferencia genética (llamadas de chat de tiempo de ejecución) que utilizan los agentes durante el tiempo de ejecución.
- Modelos de memoria de proyecto que se utilizan al agregar extracción de memoria a largo plazo y compactación de memoria a corto plazo a un proyecto de OCI Generative AI.
1. Modelos de inferencia de Agentic (tiempo de ejecución)
Modelos de chat disponibles para agentes
Los agentes pueden llamar a los siguientes modelos de chat para casos de uso de inferencia de agentic:
- Plataforma de IA de Google Vertex
- OpenAI Código Abierto
- Plataforma xAI
Regiones disponibles
Puede acceder a modelos de inferencia de autenticación en una o más de las siguientes regiones OC1:
- América del Norte
-
- Este de EE. UU. (Ashburn)
- Medio Oeste de EE. UU. (Chicago)
- Oeste de EE. UU. (Phoenix)
- América del Sur
-
- Este de Brasil (São Paulo)
- Europa (UE)
-
- Centro de Alemania (Fráncfort)
- Sur de Reino Unido (Londres)
- Oriente Medio (ME)
-
- Arabia Saudí Central (Riad)
-
Nota
La API de Agentic no está disponible en el este de Emiratos Árabes Unidos (Dubái).
- Asia Pacífico (AP)
-
- Sur de India (Hyderabad)
- Centro de Japón (Osaka)
No todos los modelos están disponibles en todas las regiones de la lista anterior. Para obtener información detallada sobre el despliegue y las regiones soportadas por modelo, consulte la página Modelos por región.
Modelos de memoria de proyecto (Configuración de proyecto)
Cuando crea un proyecto y activa las funciones de memoria, selecciona modelos para:
- Compactación de memoria a corto plazo (compactación del historial de conversaciones)
- Extracción de memoria a largo plazo (tiene como objetivo extraer información clave de las conversaciones)
- Incorporaciones de memoria a largo plazo (almacena las memorias extraídas como vectores que se pueden buscar)
2.1 Compactación de Memoria a Corto Plazo (Compactación de Historial de Conversaciones)
Los proyectos pueden utilizar los siguientes modelos para compactación de memoria a corto plazo:
| Región | Código de Región | Embeber modelo |
|---|---|---|
| Este de Brasil (São Paulo) | sa-saopaulo-1 |
|
| Centro de Alemania (Fráncfort) | eu-frankfurt-1 |
|
| Sur de Reino Unido (Londres) | uk-london-1 |
|
| Sur de India (Hyderabad) | ap-hyderabad-1 |
|
| Este de EE. UU. (Ashburn) (entre regiones y medio oeste de EE. UU. (Chicago) | us-ahsburn-1 (entre regiones a us-chicago-1) |
|
| Centro de Japón (Osaka) | ap-osaka-1 |
|
| Arabia Saudí Central (Riad) | me-riyadh-1 |
|
| Medio Oeste de EE. UU. (Chicago) | us-chicago-1 |
|
| Oeste de EE. UU. (Phoenix) (en toda la región al medio oeste de EE. UU. (Chicago) | us-phoenix-1(entre regiones a us-chicago-1) |
|
2.2 Memoria a largo plazo
- Modelo de extracción (todas las regiones soportadas)
- OpenAI gpt-oss-120b
- Modelo de incrustación
-
El modelo de incrustación que se utiliza para almacenar memorias extraídas como vectores que se pueden buscar depende de la región Proyecto:
Región Código de Región Embeber modelo Este de Brasil (São Paulo) sa-saopaulo-1Cohere Embed Multilingüe 3 Centro de Alemania (Fráncfort) eu-frankfurt-1Cohere Embed Multilingüe 3 Sur de Reino Unido (Londres) uk-london-1Cohere Embed Multilingüe 3 Sur de India (Hyderabad) ap-hyderabad-1Imagen multilingüe incrustada de Cohere 3 Este de EE. UU. (Ashburn) (entre regiones y medio oeste de EE. UU. (Chicago) Consulte llamadas externas
us-ahsburn-1(entre regiones aus-chicago-1)Embebido Cohere 4 Centro de Japón (Osaka) ap-osaka-1Embebido Cohere 4 Arabia Saudí Central (Riad) me-riyadh-1Embebido Cohere 4 Medio Oeste de EE. UU. (Chicago) us-chicago-1Embebido Cohere 4 Oeste de EE. UU. (Phoenix) (en toda la región al medio oeste de EE. UU. (Chicago) Consulte llamadas externas
us-phoenix-1(entre regiones aus-chicago-1)Embebido Cohere 4
Notas y limitaciones conocidas
- Este de Emiratos Árabes Unidos (Dubái): la API de Agentic no está disponible en esta región.
- Disponibilidad: las regiones que se muestran para los modelos de inferencia de autenticación en esta página indican dónde están soportadas las funciones de autenticación. La disponibilidad del modelo individual puede variar dentro de esas regiones.
Llamadas externas a modelos de Google
Llamadas externas a Google Gemini 2.5 Pro para regiones de EE. UU.
El modelo Google Gemini 2.5 Pro al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Google Gemini 2.5 Pro (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Google Gemini 2.5 Pro, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.
Llamadas externas a Gemini 2.5 Flash para regiones de EE. UU.
El modelo Gemini 2.5 Flash al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Gemini 2.5 Flash (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Flash, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.
Llamadas externas a Gemini 2.5 Flash-Lite para regiones de EE. UU.
El modelo Gemini 2.5 Flash-Lite al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Gemini 2.5 Flash-Lite (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Flash-Lite, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.