Modelos y regiones de IA generativa para agentes de IA empresarial

Los agentes de IA empresarial de OCI Generative AI admiten un subconjunto de modelos y regiones preentrenados de OCI Generative AI. Esta página muestra los modelos y regiones soportados para la inferencia de tiempo de ejecución y la memoria del proyecto.

Para llamar a modelos

Para puntos finales y herramientas compatibles con OCI-OpenAI
Nota

Los siguientes modelos están soportados para los puntos finales compatibles con OpenAI de OCI y las herramientas compatibles con OpenAI.

Modelos de chat disponibles

Los agentes pueden llamar a los siguientes modelos de chat para casos de uso de inferencia de agentic:

Plataforma de IA de Google Vertex
OpenAI Código Abierto
Plataforma xAI
Importante

Llamadas externas a modelos de Grok xAI

Los modelos de xAI Grok se alojan en un centro de datos de OCI, en un arrendamiento aprovisionado para xAI. Los modelos xAI Grok, a los que se puede acceder a través del servicio OCI Generative AI, son gestionados por xAI.

Regiones comerciales disponibles (OC1)

Puede acceder a modelos de inferencia de agentic en una o más de las siguientes regiones de OC1:

Nombre de región Ubicación Identificador de región Clave de región
Este de Brasil (São Paulo) Sao Paulo sa-saopaulo-1 GRU
Centro de Alemania (Fráncfort) Fráncfort eu-frankfurt-1 FRA
Sur de India (Hyderabad) Hyderabad ap-hyderabad-1 HYD
Centro de Japón (Osaka) Osaka ap-osaka-1 KIX
Arabia Saudí Central (Riad) Riad me-riyadh-1 RUH
Sur de Reino Unido (Londres) London uk-london-1 LHR
Este de EE. UU. (Ashburn) Ashburn us-ashburn-1 IAD
Medio Oeste de EE. UU. (Chicago) Chicago us-chicago-1 ORD
Oeste de EE. UU. (Phoenix) Phoenix us-phoenix-1 PHX

Descubra Acerca de las regiones y los dominios de disponibilidad.

Nota

  • Este de Emiratos Árabes Unidos (Dubái): las herramientas y los puntos finales compatibles con OCI-OpenAI no están disponibles en esta región.
  • Disponibilidad: no todos los modelos mostrados están disponibles en las regiones anteriores. Para obtener información detallada sobre el despliegue y las regiones soportadas por modelo, consulte la página Modelos por región.
  • Llamadas externas: para obtener notas sobre modelos con llamadas externas, consulte Llamadas externas.

Para activar la memoria del proyecto

Para Compactación de Memoria a Corto Plazo (Historial de Conversaciones)

Al crear un proyecto, puede activar la compactación de memoria a corto plazo para conversaciones y respuestas relacionadas con ese proyecto. Consulte la siguiente tabla para conocer los modelos y las regiones disponibles para la compactación de memoria.

Región Código de Región Modelo de memoria a corto plazo
Este de Brasil (São Paulo) sa-saopaulo-1
Centro de Alemania (Fráncfort) eu-frankfurt-1
Sur de Reino Unido (Londres) uk-london-1
Sur de India (Hyderabad) ap-hyderabad-1
Este de EE. UU. (Ashburn) (entre regiones y medio oeste de EE. UU. (Chicago) us-ahsburn-1 (entre regiones a us-chicago-1)
Centro de Japón (Osaka) ap-osaka-1
Arabia Saudí Central (Riad) me-riyadh-1
Medio Oeste de EE. UU. (Chicago) us-chicago-1
Oeste de EE. UU. (Phoenix) (en toda la región al medio oeste de EE. UU. (Chicago) us-phoenix-1(entre regiones a us-chicago-1)

Para extraer información clave para la memoria a largo plazo

sombrero

Al crear un proyecto, puede activar la extracción de información de conversaciones y respuestas para una función de memoria a largo plazo. Seleccione un modelo de extracción que tenga como objetivo extraer información clave de las conversaciones. Consulte la siguiente tabla para conocer las regiones y el modelo soportados para extraer información clave que se utilizará para la memoria a largo plazo.

Región Modelo de extracción disponible
Las regiones comerciales disponibles (OC1) hacen referencia cruzada con regiones que OpenAI gpt-oss-120b está disponible. OpenAI gpt-oss-120b
Para almacenar información clave como incrustaciones para memoria a largo plazo

Al crear un proyecto, puede seleccionar un modelo de embebido para almacenar las memorias extraídas como vectores que se pueden buscar. El modelo de embebido disponible depende de la región del proyecto. Consulte la siguiente tabla para conocer el modelo de embebido disponible en cada región:

Región Código de Región Modelo incrustado disponible
Este de Brasil (São Paulo) sa-saopaulo-1 Cohere Embed Multilingual 3 (en desuso)
Centro de Alemania (Fráncfort) eu-frankfurt-1 Cohere Embed Multilingual 3 (en desuso)
Sur de Reino Unido (Londres) uk-london-1 Cohere Embed Multilingual 3 (en desuso)
Sur de India (Hyderabad) ap-hyderabad-1 Cohere Embed Multilingual Image 3 (en desuso)
Este de EE. UU. (Ashburn) (entre regiones y medio oeste de EE. UU. (Chicago) us-ahsburn-1 Embebido Cohere 4
Centro de Japón (Osaka) ap-osaka-1 Embebido Cohere 4
Arabia Saudí Central (Riad) me-riyadh-1 Embebido Cohere 4
Medio Oeste de EE. UU. (Chicago) us-chicago-1 Embebido Cohere 4
Oeste de EE. UU. (Phoenix) (en toda la región al medio oeste de EE. UU. (Chicago) us-phoenix-1 Embebido Cohere 4

Llamadas Externas

Llamadas externas a modelos de Grok xAI

Importante

Llamadas externas a modelos de Grok xAI

Los modelos de xAI Grok se alojan en un centro de datos de OCI, en un arrendamiento aprovisionado para xAI. Los modelos xAI Grok, a los que se puede acceder a través del servicio OCI Generative AI, son gestionados por xAI.

Llamadas externas a modelos de Google

Importante

Llamadas externas a Google Gemini 2.5 Pro para regiones de EE. UU.

El modelo Google Gemini 2.5 Pro al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Google Gemini 2.5 Pro (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Google Gemini 2.5 Pro, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.

Importante

Llamadas externas a Gemini 2.5 Flash para regiones de EE. UU.

El modelo Gemini 2.5 Flash al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Gemini 2.5 Flash (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Flash, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.

Importante

Llamadas externas a Gemini 2.5 Flash-Lite para regiones de EE. UU.

El modelo Gemini 2.5 Flash-Lite al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Gemini 2.5 Flash-Lite (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Flash-Lite, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.