Modelos y regiones de IA generativa para la API de Agentic

Esta página muestra el subjuego de modelos y regiones previamente entrenados soportado para funciones de autenticación en OCI Generative AI.

Las funciones de Agentic incluyen:

  • Inferencia genética (llamadas de chat de tiempo de ejecución) que utilizan los agentes durante el tiempo de ejecución.
  • Modelos de memoria de proyecto que se utilizan al agregar extracción de memoria a largo plazo y compactación de memoria a corto plazo a un proyecto de OCI Generative AI.

1. Modelos de inferencia de Agentic (tiempo de ejecución)

Modelos de chat disponibles para agentes

Los agentes pueden llamar a los siguientes modelos de chat para casos de uso de inferencia de agentic:

Plataforma de IA de Google Vertex
OpenAI Código Abierto
Plataforma xAI

Regiones disponibles

Puede acceder a modelos de inferencia de autenticación en una o más de las siguientes regiones OC1:

América del Norte
  • Este de EE. UU. (Ashburn)
  • Medio Oeste de EE. UU. (Chicago)
  • Oeste de EE. UU. (Phoenix)
América del Sur
  • Este de Brasil (São Paulo)
Europa (UE)
  • Centro de Alemania (Fráncfort)
  • Sur de Reino Unido (Londres)
Oriente Medio (ME)
  • Arabia Saudí Central (Riad)
  • Nota

    La API de Agentic no está disponible en el este de Emiratos Árabes Unidos (Dubái).
Asia Pacífico (AP)
  • Sur de India (Hyderabad)
  • Centro de Japón (Osaka)
Importante

No todos los modelos están disponibles en todas las regiones de la lista anterior. Para obtener información detallada sobre el despliegue y las regiones soportadas por modelo, consulte la página Modelos por región.

Modelos de memoria de proyecto (Configuración de proyecto)

Cuando crea un proyecto y activa las funciones de memoria, selecciona modelos para:

  • Compactación de memoria a corto plazo (compactación del historial de conversaciones)
  • Extracción de memoria a largo plazo (tiene como objetivo extraer información clave de las conversaciones)
  • Incorporaciones de memoria a largo plazo (almacena las memorias extraídas como vectores que se pueden buscar)

2.1 Compactación de Memoria a Corto Plazo (Compactación de Historial de Conversaciones)

Los proyectos pueden utilizar los siguientes modelos para compactación de memoria a corto plazo:

Región Código de Región Embeber modelo
Este de Brasil (São Paulo) sa-saopaulo-1
Meta
OpenAI Código Abierto
Centro de Alemania (Fráncfort) eu-frankfurt-1
Plataforma de IA de Google Vertex
Meta
OpenAI Código Abierto
Sur de Reino Unido (Londres) uk-london-1
Plataforma de IA de Google Vertex
Meta
OpenAI Código Abierto
Sur de India (Hyderabad) ap-hyderabad-1
Plataforma de IA de Google Vertex
Meta
OpenAI Código Abierto
Este de EE. UU. (Ashburn) (entre regiones y medio oeste de EE. UU. (Chicago) us-ahsburn-1 (entre regiones a us-chicago-1)
Plataforma de IA de Google Vertex
Meta
OpenAI Código Abierto
Centro de Japón (Osaka) ap-osaka-1
Plataforma de IA de Google Vertex
Meta
OpenAI Código Abierto
Arabia Saudí Central (Riad) me-riyadh-1
Meta
OpenAI Código Abierto
Medio Oeste de EE. UU. (Chicago) us-chicago-1
Plataforma de IA de Google Vertex
Meta
OpenAI Código Abierto
Oeste de EE. UU. (Phoenix) (en toda la región al medio oeste de EE. UU. (Chicago) us-phoenix-1(entre regiones a us-chicago-1)
Plataforma de IA de Google Vertex
Meta
OpenAI Código Abierto

2.2 Memoria a largo plazo

Modelo de extracción (todas las regiones soportadas)
OpenAI gpt-oss-120b
Modelo de incrustación

El modelo de incrustación que se utiliza para almacenar memorias extraídas como vectores que se pueden buscar depende de la región Proyecto:

Región Código de Región Embeber modelo
Este de Brasil (São Paulo) sa-saopaulo-1 Cohere Embed Multilingüe 3
Centro de Alemania (Fráncfort) eu-frankfurt-1 Cohere Embed Multilingüe 3
Sur de Reino Unido (Londres) uk-london-1 Cohere Embed Multilingüe 3
Sur de India (Hyderabad) ap-hyderabad-1 Imagen multilingüe incrustada de Cohere 3
Este de EE. UU. (Ashburn) (entre regiones y medio oeste de EE. UU. (Chicago)

Consulte llamadas externas

us-ahsburn-1 (entre regiones a us-chicago-1) Embebido Cohere 4
Centro de Japón (Osaka) ap-osaka-1 Embebido Cohere 4
Arabia Saudí Central (Riad) me-riyadh-1 Embebido Cohere 4
Medio Oeste de EE. UU. (Chicago) us-chicago-1 Embebido Cohere 4
Oeste de EE. UU. (Phoenix) (en toda la región al medio oeste de EE. UU. (Chicago)

Consulte llamadas externas

us-phoenix-1 (entre regiones a us-chicago-1) Embebido Cohere 4

Notas y limitaciones conocidas

  • Este de Emiratos Árabes Unidos (Dubái): la API de Agentic no está disponible en esta región.
  • Disponibilidad: las regiones que se muestran para los modelos de inferencia de autenticación en esta página indican dónde están soportadas las funciones de autenticación. La disponibilidad del modelo individual puede variar dentro de esas regiones.

Llamadas externas a modelos de Google

Importante

Llamadas externas a Google Gemini 2.5 Pro para regiones de EE. UU.

El modelo Google Gemini 2.5 Pro al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Google Gemini 2.5 Pro (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Google Gemini 2.5 Pro, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.

Importante

Llamadas externas a Gemini 2.5 Flash para regiones de EE. UU.

El modelo Gemini 2.5 Flash al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Gemini 2.5 Flash (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Flash, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.

Importante

Llamadas externas a Gemini 2.5 Flash-Lite para regiones de EE. UU.

El modelo Gemini 2.5 Flash-Lite al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Gemini 2.5 Flash-Lite (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Flash-Lite, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.