Modelos y regiones de IA generativa para agentes de IA empresarial
Los agentes de IA empresarial de OCI Generative AI admiten un subconjunto de modelos y regiones preentrenados de OCI Generative AI. Esta página muestra los modelos y regiones soportados para la inferencia de tiempo de ejecución y la memoria del proyecto.
Para llamar a modelos
Los siguientes modelos están soportados para los puntos finales compatibles con OpenAI de OCI y las herramientas compatibles con OpenAI.
Modelos de chat disponibles
Los agentes pueden llamar a los siguientes modelos de chat para casos de uso de inferencia de agentic:
- Plataforma de IA de Google Vertex
- OpenAI Código Abierto
- Plataforma xAI
-
- xAI Grok 4.3
- Grupo de xAI 4.20 multiagente
- xAI Grok 4.20
- xAI - Código de Grok rápido 1 (en desuso)
- xAI Grok 4.1 rápido (en desuso)
- xAI Grok 4 rápido (en desuso)
- Grok 4 de xAI (en desuso)
- xAI Grok 3 (en desuso)
- xAI Grok 3 Mini (en desuso)
- xAI Grok 3 rápido (en desuso)
- xAI Grok 3 Mini Fast (en desuso)
Llamadas externas a modelos de Grok xAI
Los modelos de xAI Grok se alojan en un centro de datos de OCI, en un arrendamiento aprovisionado para xAI. Los modelos xAI Grok, a los que se puede acceder a través del servicio OCI Generative AI, son gestionados por xAI.
Regiones comerciales disponibles (OC1)
Puede acceder a modelos de inferencia de agentic en una o más de las siguientes regiones de OC1:
| Nombre de región | Ubicación | Identificador de región | Clave de región |
|---|---|---|---|
| Este de Brasil (São Paulo) | Sao Paulo |
sa-saopaulo-1
|
GRU
|
| Centro de Alemania (Fráncfort) | Fráncfort |
eu-frankfurt-1
|
FRA
|
| Sur de India (Hyderabad) | Hyderabad |
ap-hyderabad-1
|
HYD
|
| Centro de Japón (Osaka) | Osaka |
ap-osaka-1
|
KIX
|
| Arabia Saudí Central (Riad) | Riad |
me-riyadh-1
|
RUH
|
| Sur de Reino Unido (Londres) | London |
uk-london-1
|
LHR
|
| Este de EE. UU. (Ashburn) | Ashburn |
us-ashburn-1
|
IAD
|
| Medio Oeste de EE. UU. (Chicago) | Chicago |
us-chicago-1
|
ORD
|
| Oeste de EE. UU. (Phoenix) | Phoenix |
us-phoenix-1
|
PHX
|
Descubra Acerca de las regiones y los dominios de disponibilidad.
- Este de Emiratos Árabes Unidos (Dubái): las herramientas y los puntos finales compatibles con OCI-OpenAI no están disponibles en esta región.
- Disponibilidad: no todos los modelos mostrados están disponibles en las regiones anteriores. Para obtener información detallada sobre el despliegue y las regiones soportadas por modelo, consulte la página Modelos por región.
- Llamadas externas: para obtener notas sobre modelos con llamadas externas, consulte Llamadas externas.
Para activar la memoria del proyecto
Al crear un proyecto, puede activar la compactación de memoria a corto plazo para conversaciones y respuestas relacionadas con ese proyecto. Consulte la siguiente tabla para conocer los modelos y las regiones disponibles para la compactación de memoria.
| Región | Código de Región | Modelo de memoria a corto plazo |
|---|---|---|
| Este de Brasil (São Paulo) | sa-saopaulo-1 |
|
| Centro de Alemania (Fráncfort) | eu-frankfurt-1 |
|
| Sur de Reino Unido (Londres) | uk-london-1 |
|
| Sur de India (Hyderabad) | ap-hyderabad-1 |
|
| Este de EE. UU. (Ashburn) (entre regiones y medio oeste de EE. UU. (Chicago) | us-ahsburn-1 (entre regiones a us-chicago-1) |
|
| Centro de Japón (Osaka) | ap-osaka-1 |
|
| Arabia Saudí Central (Riad) | me-riyadh-1 |
|
| Medio Oeste de EE. UU. (Chicago) | us-chicago-1 |
|
| Oeste de EE. UU. (Phoenix) (en toda la región al medio oeste de EE. UU. (Chicago) | us-phoenix-1(entre regiones a us-chicago-1) |
Para extraer información clave para la memoria a largo plazo
sombrero
Al crear un proyecto, puede activar la extracción de información de conversaciones y respuestas para una función de memoria a largo plazo. Seleccione un modelo de extracción que tenga como objetivo extraer información clave de las conversaciones. Consulte la siguiente tabla para conocer las regiones y el modelo soportados para extraer información clave que se utilizará para la memoria a largo plazo.
| Región | Modelo de extracción disponible |
|---|---|
| Las regiones comerciales disponibles (OC1) hacen referencia cruzada con regiones que OpenAI gpt-oss-120b está disponible. | OpenAI gpt-oss-120b |
Al crear un proyecto, puede seleccionar un modelo de embebido para almacenar las memorias extraídas como vectores que se pueden buscar. El modelo de embebido disponible depende de la región del proyecto. Consulte la siguiente tabla para conocer el modelo de embebido disponible en cada región:
| Región | Código de Región | Modelo incrustado disponible |
|---|---|---|
| Este de Brasil (São Paulo) | sa-saopaulo-1 |
Cohere Embed Multilingual 3 (en desuso) |
| Centro de Alemania (Fráncfort) | eu-frankfurt-1 |
Cohere Embed Multilingual 3 (en desuso) |
| Sur de Reino Unido (Londres) | uk-london-1 |
Cohere Embed Multilingual 3 (en desuso) |
| Sur de India (Hyderabad) | ap-hyderabad-1 |
Cohere Embed Multilingual Image 3 (en desuso) |
| Este de EE. UU. (Ashburn) (entre regiones y medio oeste de EE. UU. (Chicago) | us-ahsburn-1 |
Embebido Cohere 4 |
| Centro de Japón (Osaka) | ap-osaka-1 |
Embebido Cohere 4 |
| Arabia Saudí Central (Riad) | me-riyadh-1 |
Embebido Cohere 4 |
| Medio Oeste de EE. UU. (Chicago) | us-chicago-1 |
Embebido Cohere 4 |
| Oeste de EE. UU. (Phoenix) (en toda la región al medio oeste de EE. UU. (Chicago) | us-phoenix-1
|
Embebido Cohere 4 |
Llamadas Externas
Llamadas externas a modelos de Grok xAI
Llamadas externas a modelos de Grok xAI
Los modelos de xAI Grok se alojan en un centro de datos de OCI, en un arrendamiento aprovisionado para xAI. Los modelos xAI Grok, a los que se puede acceder a través del servicio OCI Generative AI, son gestionados por xAI.
Llamadas externas a modelos de Google
Llamadas externas a Google Gemini 2.5 Pro para regiones de EE. UU.
El modelo Google Gemini 2.5 Pro al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Google Gemini 2.5 Pro (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Google Gemini 2.5 Pro, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.
Llamadas externas a Gemini 2.5 Flash para regiones de EE. UU.
El modelo Gemini 2.5 Flash al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Gemini 2.5 Flash (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Flash, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.
Llamadas externas a Gemini 2.5 Flash-Lite para regiones de EE. UU.
El modelo Gemini 2.5 Flash-Lite al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Gemini 2.5 Flash-Lite (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Flash-Lite, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.