Unidades de cluster dedicadas de IA generativa por región

Esta página proporciona una lista de regiones en las que están disponibles los modelos de IA generativa de OCI. También muestra las unidades de cluster de IA dedicadas para alojar esos modelos en cada región. Seleccione cada modelo para sus detalles.

Importante

Cada región de la tabla tiene uno de los siguientes símbolos:

Leyenda de Tabla
Symbol Descripción
disponible (clusters de IA dedicados y bajo demanda)
o Solo a petición
d (D) solo clusters de AI dedicados
G disponible solo a través de Oracle Interconnect for Google Cloud
- no disponible

<unidad de cluster>

Unidad de cluster de IA dedicada para alojar el modelo

Norteamérica (NA)

Nombre de modelo Este de EE. UU. (Ashburn)

(OC1)

Medio Oeste de EE. UU. (Chicago)

(OC1)

Oeste de EE. UU. (Phoenix)

(OC1)

Notas
Cohere ordena un razonamiento d (D)

LARGE_COHERE_V2_2

d (D)

LARGE_COHERE_V2_2

d (D)

LARGE_COHERE_V2_2

-
Comando Cohere Una Visión d (D)

LARGE_COHERE_V3

LARGE_COHERE_V3

d (D)

LARGE_COHERE_V3

-
Comando A de Cohere d (D)

LARGE_COHERE_V3

LARGE_COHERE_V3

- -
Comando Cohere R (08-2024) d (D)

Cohere pequeño V2

Cohere pequeño V2

- -
Comando Cohere R+ (08-2024) d (D)

Cohere grande V2_2

Cohere grande V2_2

- -
Comando Cohere R 16K -

Cohere pequeño V2

- -
Comando Cohere R+ -

Cohere grande V2_2

- -
Embebido Cohere 4

Embeber Cohere

Embeber Cohere

- -
Imagen en inglés de Cohere Embed 3 d (D)

Embeber Cohere

d (D)

Embeber Cohere

- -
Cohere Embed English Light Imagen 3 d (D)

Embeber Cohere

d (D)

Embeber Cohere

- -
Imagen multilingüe incrustada de Cohere 3 d (D)

Embeber Cohere

Embeber Cohere

- -
Cohere incrustó una imagen de luz multilingüe 3 d (D)

Embeber Cohere

d (D)

Embeber Cohere

- -
Inglés de Cohere Embed 3 -

Embeber Cohere

- -
Cohere Embed English Light 3 -

Embeber Cohere

- -
Cohere Embed Multilingüe 3 d (D)

Embeber Cohere

-
Cohere Embed Multilingual Light 3 -

Embeber Cohere

- -
Cohere Rerank 3.5 d (D)

RERANK_COHERE

d (D)

RERANK_COHERE

- -
Google Gemini 2.5 Pro o + G o o Consulte Llamadas externas.
Google Gemini 2.5 Flash o + G o o Consulte Llamadas externas.
Google Gemini 2.5 Flash-Lite o + G o o Consulte Llamadas externas.
Meta Llama 4 Maverick -

Grande genérico 2

- -
Meta Llama 4 Scout -

Grande genérico V2

- -
Meta Llama 3.3 70B (estándar) -

Grande genérico

- -
Meta Llama 3.3 70B (Dinámico FP8) -

Grande genérico

Grande genérico

-
Meta Llama 3.2 90B -

Grande genérico V2

- -
Meta Llama 3.2 11B Visión - d (D)

Pequeño genérico V2

- -
Meta Llama 3.1 405B -

Grande genérico 2

- -
Meta Llama 3.1 70B -

Grande genérico

- -
Meta Llama 3 70B -

Grande genérico

- -
OpenAI gpt-oss-120b d (D)

OAI_H100_X2

OAI_A100_80G_X2

OAI_H100_X2

d (D)

OAI_A100_80G_X2

-
OpenAI gpt-oss-20b d (D)

OAI_A10_X2

OAI_H100_X1

OAI_A10_X2

OAI_H100_X1

d (D)

OAI_A100_80G_X1

-
Grupo de xAI 4.20 multiagente o o o Consulte Llamadas externas.
Grupo xAI 4.20 o o o Consulte Llamadas externas.
xAI - Código de grupo - Rápido 1 o o o Consulte Llamadas externas.
Rápido de xAI Grok 4.1 o o o Consulte Llamadas externas.
xAI - Grupo 4 - Rápido o o o Consulte Llamadas externas.
Grupo 4 de xAI o o o Consulte Llamadas externas.
Grupo de xAI 3 o o o Consulte Llamadas externas.
xAI Grok 3 Mini o o o Consulte Llamadas externas.
xAI - Grupo 3 - Rápido o o o Consulte Llamadas externas.
xAI Grok 3 Mini rápido o o o Consulte Llamadas externas.

América del Sur (SA)

Nombre de modelo Este de Brasil (São Paulo)

(OC1)

Cohere ordena un razonamiento d (D)

LARGE_COHERE_V2_2

Comando Cohere Una Visión d (D)

LARGE_COHERE_V3

Comando A de Cohere

LARGE_COHERE_V3

Comando Cohere R (08-2024)

Cohere pequeño V2

Comando Cohere R+ (08-2024)

Cohere grande V2_2

Comando Cohere R 16K

Cohere pequeño V2

Comando Cohere R+

Cohere grande V2_2

Embebido Cohere 4 d (D)

Embeber Cohere

Imagen en inglés de Cohere Embed 3 d (D)

Embeber Cohere

Cohere Embed English Light Imagen 3 d (D)

Embeber Cohere

Imagen multilingüe incrustada de Cohere 3 d (D)

Embeber Cohere

Cohere incrustó una imagen de luz multilingüe 3 d (D)

Embeber Cohere

Inglés de Cohere Embed 3

Embeber Cohere

Cohere Embed English Light 3 -
Cohere Embed Multilingüe 3

Embeber Cohere

Cohere Embed Multilingual Light 3 -
Cohere Rerank 3.5 d (D)

RERANK_COHERE

Google Gemini 2.5 Pro -
Google Gemini 2.5 Flash -
Google Gemini 2.5 Flash-Lite -
Meta Llama 4 Maverick d (D)

Grande genérico 2

Meta Llama 4 Scout d (D)

Grande genérico V2

Meta Llama 3.3 70B (estándar)

Grande genérico

Meta Llama 3.3 70B (Dinámico FP8)

Grande genérico

Meta Llama 3.2 90B

Grande genérico V2

Meta Llama 3.2 11B Visión d (D)

Pequeño genérico V2

Meta Llama 3.1 405B d (D)

Grande genérico 2

Meta Llama 3.1 70B
Meta Llama 3 70B
OpenAI gpt-oss-120b d (D)

OAI_H100_X2

OpenAI gpt-oss-20b d (D)

OAI_H100_X1

Grupo de xAI 4.20 multiagente -
Grupo xAI 4.20 -
xAI - Código de grupo - Rápido 1 -
Rápido de xAI Grok 4.1 -
xAI - Grupo 4 - Rápido -
Grupo 4 de xAI -
Grupo de xAI 3 -
xAI Grok 3 Mini -
xAI - Grupo 3 - Rápido -
xAI Grok 3 Mini rápido -

Europa (UE)

Nombre de modelo Centro de Alemania (Fráncfort)

(OC1)

EU Sovereign Central (Fráncfort)

(OC19)

Sur de Reino Unido (Londres)

(OC1)

Gobierno de Reino Unido zona sur (Londres)

(OC4)

Notas
Cohere ordena un razonamiento d (D)

LARGE_COHERE_V2_2

- d (D)

LARGE_COHERE_V2_2

- -
Comando Cohere Una Visión

LARGE_COHERE_V3

- d (D)

LARGE_COHERE_V3

- -
Comando A de Cohere

LARGE_COHERE_V3

d (D)

LARGE_COHERE_V3

LARGE_COHERE_V3

- -
Comando Cohere R (08-2024)

Cohere pequeño V2

-

Cohere pequeño V2

- -
Comando Cohere R+ (08-2024)

Cohere grande V2_2

-

Cohere grande V2_2

- -
Comando Cohere R 16K

Cohere pequeño V2

-

Cohere pequeño V2

- -
Comando Cohere R+

Cohere grande V2_2

-

Cohere grande V2_2

- -
Embebido Cohere 4 d (D)

Embeber Cohere

- d (D)

Embeber Cohere

- -
Imagen en inglés de Cohere Embed 3 d (D)

Embeber Cohere

- d (D)

Embeber Cohere

- -
Cohere Embed English Light Imagen 3 d (D)

Embeber Cohere

- d (D)

Embeber Cohere

- -
Imagen multilingüe incrustada de Cohere 3 d (D)

Embeber Cohere

- d (D)

Embeber Cohere

- -
Cohere incrustó una imagen de luz multilingüe 3 d (D)

Embeber Cohere

- d (D)

Embeber Cohere

- -
Inglés de Cohere Embed 3

Embeber Cohere

-

Embeber Cohere

- -
Cohere Embed English Light 3 - - - - -
Cohere Embed Multilingüe 3

Embeber Cohere

d (D)

Embeber Cohere

Embeber Cohere

d (D)

Embeber Cohere

-
Cohere Embed Multilingual Light 3 - - - - -
Cohere Rerank 3.5 d (D)

RERANK_COHERE

d (D)

RERANK_COHERE

d (D)

RERANK_COHERE

d (D)

RERANK_COHERE

-
Google Gemini 2.5 Pro o + G - - - Consulte Llamadas externas.
Google Gemini 2.5 Flash o + G - - - Consulte Llamadas externas.
Google Gemini 2.5 Flash-Lite o + G - - - Consulte Llamadas externas.
Meta Llama 4 Maverick - - d (D)

Grande genérico 2

- -
Meta Llama 4 Scout - - d (D)

Grande genérico V2

- -
Meta Llama 3.3 70B (estándar)

Grande genérico

d (D)

Grande genérico

Grande genérico

d (D)

Grande genérico

-
Meta Llama 3.3 70B (Dinámico FP8)

Grande genérico

Grande genérico

Grande genérico

Grande genérico

-
Meta Llama 3.2 90B - -

Grande genérico V2

- -
Meta Llama 3.2 11B Visión - - d (D)

Pequeño genérico V2

d (D)

Pequeño genérico V2

-
Meta Llama 3.1 405B d (D)

Grande genérico 2

- d (D)

Grande genérico 2

- -
Meta Llama 3.1 70B - -

Grande genérico

- -
Meta Llama 3 70B

Grande genérico

-

Grande genérico

- -
OpenAI gpt-oss-120b

OAI_H100_X2

d (D)

OAI_H100_X2

d (D)

OAI_H100_X2

d (D)

OAI_H100_X2

-
OpenAI gpt-oss-20b

OAI_A10_X2

OAI_H100_X1

d (D)

OAI_A10_X2

OAI_H100_X1

d (D)

OAI_H100_X1

d (D)

OAI_H100_X1

-
Grupo de xAI 4.20 multiagente - - - - -
Grupo xAI 4.20 - - - - -
xAI - Código de grupo - Rápido 1 - - - - -
Rápido de xAI Grok 4.1 - - - - -
xAI - Grupo 4 - Rápido - - - - -
Grupo 4 de xAI - - - - -
Grupo de xAI 3 - - - - -
xAI Grok 3 Mini - - - - -
xAI - Grupo 3 - Rápido - - - - -
xAI Grok 3 Mini rápido - - - - -

Oriente Medio (ME)

Nombre de modelo Arabia Saudí Central (Riad)

(OC1)

Emiratos Árabes Unidos oriental (Dubái)

(OC1)

Cohere ordena un razonamiento d (D)

LARGE_COHERE_V2_2

d (D)

SMALL_COHERE_4

Comando Cohere Una Visión d (D)

LARGE_COHERE_V3

d (D)

SMALL_COHERE_4

Comando A de Cohere

LARGE_COHERE_V3

d (D)

SMALL_COHERE_4

Comando Cohere R (08-2024) d (D)

Cohere pequeño V2

-
Comando Cohere R+ (08-2024) d (D)

Cohere grande V2_2

d (D)

Cohere grande

Comando Cohere R 16K - -
Comando Cohere R+ (Retirado) - -
Embebido Cohere 4

Embeber Cohere

d (D)

Embeber Cohere

Imagen en inglés de Cohere Embed 3 - d (D)

Embeber Cohere

Cohere Embed English Light Imagen 3 - d (D)

Embeber Cohere

Imagen multilingüe incrustada de Cohere 3 - d (D)

Embeber Cohere

Cohere incrustó una imagen de luz multilingüe 3 - d (D)

Embeber Cohere

Inglés de Cohere Embed 3 - d (D)

Embeber Cohere

Cohere Embed English Light 3 - -
Cohere Embed Multilingüe 3 d (D)

Embeber Cohere

d (D)

Embeber Cohere

Cohere Embed Multilingual Light 3 - -
Cohere Rerank 3.5 d (D)

RERANK_COHERE

-
Google Gemini 2.5 Pro - -
Google Gemini 2.5 Flash - -
Google Gemini 2.5 Flash-Lite - -
Meta Llama 4 Maverick d (D)

Grande genérico 2

-
Meta Llama 4 Scout d (D)

Grande genérico V2

-
Meta Llama 3.3 70B (estándar) d (D)

Grande genérico

-
Meta Llama 3.3 70B (Dinámico FP8) - d (D)

LARGE_GENERIC_V1

Meta Llama 3.2 90B d (D)

Grande genérico V2

-
Meta Llama 3.2 11B Visión - -
Meta Llama 3.1 405B - -
Meta Llama 3.1 70B - -
Meta Llama 3 70B - -
OpenAI gpt-oss-120b d (D)

OAI_H200_X1

d (D)

OAI_A100_40G_X1

OpenAI gpt-oss-20b d (D)

OAI_H200_X1

d (D)

OAI_A10_X2

OAI_A100_40G_X1

Grupo de xAI 4.20 multiagente - -
Grupo xAI 4.20 - -
xAI - Código de grupo - Rápido 1 - -
Rápido de xAI Grok 4.1 - -
xAI - Grupo 4 - Rápido - -
Grupo 4 de xAI - -
Grupo de xAI 3 - -
xAI Grok 3 Mini - -
xAI - Grupo 3 - Rápido - -
xAI Grok 3 Mini rápido - -

Asia Pacífico (AP)

Nombre de modelo Sur de India (Hyderabad)

(OC1)

Centro de Japón (Osaka)

(OC1)

Notas
Cohere ordena un razonamiento d (D)

LARGE_COHERE_V2_2

d (D)

LARGE_COHERE_V2_2

-
Comando Cohere Una Visión d (D)

LARGE_COHERE_V3

d (D)

LARGE_COHERE_V3

-
Comando A de Cohere

LARGE_COHERE_V3

LARGE_COHERE_V3

-
Comando Cohere R (08-2024) -

Cohere pequeño V2

-
Comando Cohere R+ (08-2024) -

Cohere grande V2_2

-
Comando Cohere R 16K - d (D)

Cohere pequeño V2

-
Comando Cohere R+ (Retirado) - - -
Embebido Cohere 4 d (D)

Embeber Cohere

Embeber Cohere

-
Imagen en inglés de Cohere Embed 3 - d (D)

Embeber Cohere

-
Cohere Embed English Light Imagen 3 - d (D)

Embeber Cohere

-
Imagen multilingüe incrustada de Cohere 3

Embeber Cohere

d (D)

Embeber Cohere

-
Cohere incrustó una imagen de luz multilingüe 3 - d (D)

Embeber Cohere

-
Inglés de Cohere Embed 3 -

Embeber Cohere

-
Cohere Embed English Light 3 - -

Embeber Cohere

-
Cohere Embed Multilingüe 3 - -
Cohere Embed Multilingual Light 3 - - -
Cohere Rerank 3.5 - d (D)

RERANK_COHERE

-
Google Gemini 2.5 Pro - o Consulte Llamadas externas.
Google Gemini 2.5 Flash o o Consulte Llamadas externas.
Google Gemini 2.5 Flash-Lite - - -
Meta Llama 4 Maverick d (D)

Grande genérico 2

d (D)

Grande genérico 2

-
Meta Llama 4 Scout d (D)

Grande genérico V2

d (D)

Grande genérico V2

-
Meta Llama 3.3 70B (estándar) d (D)

Grande genérico

Grande genérico

-
Meta Llama 3.3 70B (Dinámico FP8) d (D)

Grande genérico

Grande genérico

-
Meta Llama 3.2 90B -

Grande genérico V2

-
Meta Llama 3.2 11B Visión - d (D)

Pequeño genérico V2

-
Meta Llama 3.1 405B - d (D)

Grande genérico 2

-
Meta Llama 3.1 70B -

Grande genérico

-
Meta Llama 3 70B - - -
OpenAI gpt-oss-120b d (D)

OAI_H100_X2

OAI_H100_X2

-
OpenAI gpt-oss-20b d (D)

OAI_H100_X1

OAI_H100_X1

-
Grupo de xAI 4.20 multiagente - - -
Grupo xAI 4.20 - - -
xAI - Código de grupo - Rápido 1 - - -
Rápido de xAI Grok 4.1 - - -
xAI - Grupo 4 - Rápido - - -
Grupo 4 de xAI - - -
Grupo de xAI 3 - - -
xAI Grok 3 Mini - - -
xAI - Grupo 3 - Rápido - - -
xAI Grok 3 Mini rápido - - -

Notas para llamadas externas

Modelos de Google

Importante

Llamadas externas a Google Gemini 2.5 Pro para regiones de EE. UU.

El modelo Google Gemini 2.5 Pro al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Google Gemini 2.5 Pro (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Google Gemini 2.5 Pro, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.

Importante

Llamadas externas a Google Gemini 2.5 Pro para regiones de la UE

El modelo Google Gemini 2.5 Pro al que se puede acceder a través del servicio OCI Generative AI en la región de Frankfurt, lo aloja externamente Google. Por lo tanto, una llamada a un modelo Google Gemini 2.5 Pro (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Pro, se utiliza una ubicación regional de la Unión Europea (UE) de Google, que enruta la solicitud solo a una ubicación de la UE de Google. El procesamiento de aprendizaje automático se lleva a cabo en una ubicación de Google en la UE.

Importante

Llamadas externas a Google Gemini 2.5 Pro para regiones de cuentas a pagar

El modelo Google Gemini 2.5 Pro al que se puede acceder a través del servicio OCI Generative AI en la región de Osaka está alojado externamente por Google. Por lo tanto, una llamada a un modelo Google Gemini 2.5 Pro (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Pro, se utiliza una ubicación regional de Google Asia Pacific, que enruta la solicitud solo a una ubicación de Google Asia Pacific. El procesamiento de aprendizaje automático puede tener lugar en cualquier ubicación de Google a nivel mundial.

Importante

Llamadas externas a Gemini 2.5 Flash para regiones de EE. UU.

El modelo Gemini 2.5 Flash al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Gemini 2.5 Flash (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Flash, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.

Importante

Llamadas externas a Gemini 2.5 Flash para regiones de la UE

El modelo Gemini 2.5 Flash al que se puede acceder a través del servicio OCI Generative AI en la región de Frankfurt, lo aloja externamente Google. Por lo tanto, una llamada a un modelo Gemini 2.5 Flash (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Flash, se utiliza una ubicación regional de la Unión Europea (UE) de Google, que enruta la solicitud solo a una ubicación de la UE de Google. El procesamiento de aprendizaje automático se lleva a cabo en una ubicación de Google en la UE.

Importante

Llamadas externas a Gemini 2.5 Flash para regiones de cuentas a pagar

El modelo Gemini 2.5 Flash al que se puede acceder a través del servicio OCI Generative AI en la región de Osaka y la región de Hyderabad, lo aloja externamente Google. Por lo tanto, una llamada a un modelo Gemini 2.5 Flash (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Flash, se utiliza una ubicación regional de Google Asia Pacific, que enruta la solicitud solo a una ubicación de Google Asia Pacific. El procesamiento de aprendizaje automático puede tener lugar en cualquier ubicación de Google a nivel mundial.

Importante

Llamadas externas a Gemini 2.5 Flash-Lite para regiones de EE. UU.

El modelo Gemini 2.5 Flash-Lite al que se puede acceder a través del servicio OCI Generative AI en regiones de EE. UU., lo aloja externamente Google. Por lo tanto, una llamada a un modelo Gemini 2.5 Flash-Lite (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Flash-Lite, se utiliza una ubicación regional de Google Americas, que enruta la solicitud solo a una ubicación de Google Americas. El procesamiento de aprendizaje automático tiene lugar dentro de una ubicación de Google Americas.

Importante

Llamadas externas a Gemini 2.5 Flash-Lite para regiones de la UE

El modelo Gemini 2.5 Flash-Lite al que se puede acceder a través del servicio OCI Generative AI en la región de Frankfurt, lo aloja externamente Google. Por lo tanto, una llamada a un modelo Gemini 2.5 Flash-Lite (mediante el servicio OCI Generative AI) genera una llamada a una ubicación de Google. Para Gemini 2.5 Pro, se utiliza una ubicación regional de la Unión Europea (UE) de Google, que enruta la solicitud solo a una ubicación de la UE de Google. El procesamiento de aprendizaje automático se lleva a cabo en una ubicación de Google en la UE.

modelos xAI

Importante

Llamadas externas a modelos de Grok xAI

Los modelos de xAI Grok se alojan en un centro de datos de OCI, en un arrendamiento aprovisionado para xAI. Los modelos de xAI Grok, a los que se puede acceder a través del servicio OCI Generative AI, están gestionados por xAI.