Formas de Cluster Dedicado por IA Generativa por Região

Esta página fornece uma lista de regiões nas quais os modelos do OCI Generative AI estão disponíveis. Ele também exibe as formas de unidade de cluster de IA dedicadas para hospedar esses modelos em cada região. Selecione cada modelo para seus detalhes.

Importante

Cada região da tabela tem um dos seguintes símbolos:

Legenda da Tabela
Símbolo Descrição
disponível (clusters de IA sob demanda e dedicados)
o somente mediante demanda
d somente clusters de IA dedicados
R disponível apenas pelo Oracle Interconnect for Google Cloud
- não disponível

<forma do cluster>

A forma de cluster de IA dedicada para hospedar o modelo

América do Norte (NA)

Nome do Modelo Leste dos EUA (Ashburn)

(OC1)

Centro-Oeste dos EUA (Chicago)

(OC1)

Oeste dos EUA (Phoenix)

(OC1)

Observações
Comando Cohere Um Raciocínio d

LARGE_COHERE_V2_2

d

LARGE_COHERE_V2_2

d

LARGE_COHERE_V2_2

-
Comando Cohere Uma Visão d

LARGE_COHERE_V3

LARGE_COHERE_V3

d

LARGE_COHERE_V3

-
Comando Cohere A d

LARGE_COHERE_V3

LARGE_COHERE_V3

- -
Comando Cohere R (08-2024) d

Cohere Leve V2

Cohere Leve V2

- -
Comando R+ da Cohere (08-2024) d

Modelo Cohere de Alto Desempenho V2_2

Modelo Cohere de Alto Desempenho V2_2

- -
Comando Cohere R 16K -

Cohere Leve V2

- -
Comando Cohere R+ -

Modelo Cohere de Alto Desempenho V2_2

- -
Cohere Embed 4

Incorporar Cohere

Incorporar Cohere

- -
Cohere Incorporar Imagem em Inglês 3 d

Incorporar Cohere

d

Incorporar Cohere

- -
Cohere incorpora a imagem clara inglesa 3 d

Incorporar Cohere

d

Incorporar Cohere

- -
Cohere Incorporar Imagem Multilíngue 3 d

Incorporar Cohere

Incorporar Cohere

- -
Cohere Incorporar Imagem de Luz Multilíngue 3 d

Incorporar Cohere

d

Incorporar Cohere

- -
Cohere Embed Inglês 3 -

Incorporar Cohere

- -
Cohere Embed Inglês Luz 3 -

Incorporar Cohere

- -
Cohere Embed Multilíngue 3 d

Incorporar Cohere

-
Cohere Embed Luz Multilíngue 3 -

Incorporar Cohere

- -
Cohere Rerank 3.5 d

RERANK_COHERE

d

RERANK_COHERE

- -
Google Gemini 2.5 Pro o + G o o Consulte Chamadas Externas.
Google Gemini 2.5 Flash o + G o o Consulte Chamadas Externas.
Google Gemini 2.5 Flash-Lite o + G o o Consulte Chamadas Externas.
Meta Llama 4 Maverick -

Grande Genérico 2

- -
Meta Llama 4 Escoteiro -

Grande Genérico V2

- -
Meta Llama 3.3 70B (Padrão) -

Grande Genérico

- -
Meta Llama 3.3 70B (Dinâmico FP8) -

Grande Genérico

Grande Genérico

-
Meta Llama 3.2 90B -

Grande Genérico V2

- -
Meta Llama 3.2 11B Visão - d

Pequeno Genérico V2

- -
Meta Llama 3.1 405B -

Grande Genérico 2

- -
Meta Llama 3.1 70B -

Grande Genérico

- -
Meta Llama 3 70B -

Grande Genérico

- -
OpenAI gpt-oss-120b d

OAI_H100_X2

OAI_A100_80G_X2

OAI_H100_X2

d

OAI_A100_80G_X2

-
OpenAI gpt-oss-20b d

OAI_A10_X2

OAI_H100_X1

OAI_A10_X2

OAI_H100_X1

d

OAI_A100_80G_X1

-
xAI Grok 4.20 Multiagente o o o Consulte Chamadas Externas.
xAI Grok 4.20 o o o Consulte Chamadas Externas.
Código Grok xAI Rápido 1 o o o Consulte Chamadas Externas.
xAI Grok 4.1 Rápido o o o Consulte Chamadas Externas.
xAI Grok 4 Rápido o o o Consulte Chamadas Externas.
xAI Grok 4 o o o Consulte Chamadas Externas.
xAI Grok 3 o o o Consulte Chamadas Externas.
xAI Grok 3 Mini o o o Consulte Chamadas Externas.
xAI Grok 3 Rápido o o o Consulte Chamadas Externas.
xAI Grok 3 Mini Rápido o o o Consulte Chamadas Externas.

América do Sul (SA)

Nome do Modelo Leste do Brasil (São Paulo)

(OC1)

Comando Cohere Um Raciocínio d

LARGE_COHERE_V2_2

Comando Cohere Uma Visão d

LARGE_COHERE_V3

Comando Cohere A

LARGE_COHERE_V3

Comando Cohere R (08-2024)

Cohere Leve V2

Comando R+ da Cohere (08-2024)

Modelo Cohere de Alto Desempenho V2_2

Comando Cohere R 16K

Cohere Leve V2

Comando Cohere R+

Modelo Cohere de Alto Desempenho V2_2

Cohere Embed 4 d

Incorporar Cohere

Cohere Incorporar Imagem em Inglês 3 d

Incorporar Cohere

Cohere incorpora a imagem clara inglesa 3 d

Incorporar Cohere

Cohere Incorporar Imagem Multilíngue 3 d

Incorporar Cohere

Cohere Incorporar Imagem de Luz Multilíngue 3 d

Incorporar Cohere

Cohere Embed Inglês 3

Incorporar Cohere

Cohere Embed Inglês Luz 3 -
Cohere Embed Multilíngue 3

Incorporar Cohere

Cohere Embed Luz Multilíngue 3 -
Cohere Rerank 3.5 d

RERANK_COHERE

Google Gemini 2.5 Pro -
Google Gemini 2.5 Flash -
Google Gemini 2.5 Flash-Lite -
Meta Llama 4 Maverick d

Grande Genérico 2

Meta Llama 4 Escoteiro d

Grande Genérico V2

Meta Llama 3.3 70B (Padrão)

Grande Genérico

Meta Llama 3.3 70B (Dinâmico FP8)

Grande Genérico

Meta Llama 3.2 90B

Grande Genérico V2

Meta Llama 3.2 11B Visão d

Pequeno Genérico V2

Meta Llama 3.1 405B d

Grande Genérico 2

Meta Llama 3.1 70B
Meta Llama 3 70B
OpenAI gpt-oss-120b d

OAI_H100_X2

OpenAI gpt-oss-20b d

OAI_H100_X1

xAI Grok 4.20 Multiagente -
xAI Grok 4.20 -
Código Grok xAI Rápido 1 -
xAI Grok 4.1 Rápido -
xAI Grok 4 Rápido -
xAI Grok 4 -
xAI Grok 3 -
xAI Grok 3 Mini -
xAI Grok 3 Rápido -
xAI Grok 3 Mini Rápido -

Europa (UE)

Nome do Modelo Centro da Alemanha (Frankfurt)

(OC1)

Centro Soberano da UE (Frankfurt)

(OC19)

Sul do Reino Unido (Londres)

(OC1)

Sul do Reino Unido - Gov. (Londres)

(OC4)

Observações
Comando Cohere Um Raciocínio d

LARGE_COHERE_V2_2

- d

LARGE_COHERE_V2_2

- -
Comando Cohere Uma Visão

LARGE_COHERE_V3

- d

LARGE_COHERE_V3

- -
Comando Cohere A

LARGE_COHERE_V3

d

LARGE_COHERE_V3

LARGE_COHERE_V3

- -
Comando Cohere R (08-2024)

Cohere Leve V2

-

Cohere Leve V2

- -
Comando R+ da Cohere (08-2024)

Modelo Cohere de Alto Desempenho V2_2

-

Modelo Cohere de Alto Desempenho V2_2

- -
Comando Cohere R 16K

Cohere Leve V2

-

Cohere Leve V2

- -
Comando Cohere R+

Modelo Cohere de Alto Desempenho V2_2

-

Modelo Cohere de Alto Desempenho V2_2

- -
Cohere Embed 4 d

Incorporar Cohere

- d

Incorporar Cohere

- -
Cohere Incorporar Imagem em Inglês 3 d

Incorporar Cohere

- d

Incorporar Cohere

- -
Cohere incorpora a imagem clara inglesa 3 d

Incorporar Cohere

- d

Incorporar Cohere

- -
Cohere Incorporar Imagem Multilíngue 3 d

Incorporar Cohere

- d

Incorporar Cohere

- -
Cohere Incorporar Imagem de Luz Multilíngue 3 d

Incorporar Cohere

- d

Incorporar Cohere

- -
Cohere Embed Inglês 3

Incorporar Cohere

-

Incorporar Cohere

- -
Cohere Embed Inglês Luz 3 - - - - -
Cohere Embed Multilíngue 3

Incorporar Cohere

d

Incorporar Cohere

Incorporar Cohere

d

Incorporar Cohere

-
Cohere Embed Luz Multilíngue 3 - - - - -
Cohere Rerank 3.5 d

RERANK_COHERE

d

RERANK_COHERE

d

RERANK_COHERE

d

RERANK_COHERE

-
Google Gemini 2.5 Pro o + G - - - Consulte Chamadas Externas.
Google Gemini 2.5 Flash o + G - - - Consulte Chamadas Externas.
Google Gemini 2.5 Flash-Lite o + G - - - Consulte Chamadas Externas.
Meta Llama 4 Maverick - - d

Grande Genérico 2

- -
Meta Llama 4 Escoteiro - - d

Grande Genérico V2

- -
Meta Llama 3.3 70B (Padrão)

Grande Genérico

d

Grande Genérico

Grande Genérico

d

Grande Genérico

-
Meta Llama 3.3 70B (Dinâmico FP8)

Grande Genérico

Grande Genérico

Grande Genérico

Grande Genérico

-
Meta Llama 3.2 90B - -

Grande Genérico V2

- -
Meta Llama 3.2 11B Visão - - d

Pequeno Genérico V2

d

Pequeno Genérico V2

-
Meta Llama 3.1 405B d

Grande Genérico 2

- d

Grande Genérico 2

- -
Meta Llama 3.1 70B - -

Grande Genérico

- -
Meta Llama 3 70B

Grande Genérico

-

Grande Genérico

- -
OpenAI gpt-oss-120b

OAI_H100_X2

d

OAI_H100_X2

d

OAI_H100_X2

d

OAI_H100_X2

-
OpenAI gpt-oss-20b

OAI_A10_X2

OAI_H100_X1

d

OAI_A10_X2

OAI_H100_X1

d

OAI_H100_X1

d

OAI_H100_X1

-
xAI Grok 4.20 Multiagente - - - - -
xAI Grok 4.20 - - - - -
Código Grok xAI Rápido 1 - - - - -
xAI Grok 4.1 Rápido - - - - -
xAI Grok 4 Rápido - - - - -
xAI Grok 4 - - - - -
xAI Grok 3 - - - - -
xAI Grok 3 Mini - - - - -
xAI Grok 3 Rápido - - - - -
xAI Grok 3 Mini Rápido - - - - -

Oriente Médio (ME)

Nome do Modelo Centro da Arábia Saudita (Riade)

(OC1)

Leste dos EAU (Dubai)

(OC1)

Comando Cohere Um Raciocínio d

LARGE_COHERE_V2_2

d

SMALL_COHERE_4

Comando Cohere Uma Visão d

LARGE_COHERE_V3

d

SMALL_COHERE_4

Comando Cohere A

LARGE_COHERE_V3

d

SMALL_COHERE_4

Comando Cohere R (08-2024) d

Cohere Leve V2

-
Comando R+ da Cohere (08-2024) d

Modelo Cohere de Alto Desempenho V2_2

d

Modelo Cohere de Alto Desempenho

Comando Cohere R 16K - -
Comando R+ Cohere (Retirado) - -
Cohere Embed 4

Incorporar Cohere

d

Incorporar Cohere

Cohere Incorporar Imagem em Inglês 3 - d

Incorporar Cohere

Cohere incorpora a imagem clara inglesa 3 - d

Incorporar Cohere

Cohere Incorporar Imagem Multilíngue 3 - d

Incorporar Cohere

Cohere Incorporar Imagem de Luz Multilíngue 3 - d

Incorporar Cohere

Cohere Embed Inglês 3 - d

Incorporar Cohere

Cohere Embed Inglês Luz 3 - -
Cohere Embed Multilíngue 3 d

Incorporar Cohere

d

Incorporar Cohere

Cohere Embed Luz Multilíngue 3 - -
Cohere Rerank 3.5 d

RERANK_COHERE

-
Google Gemini 2.5 Pro - -
Google Gemini 2.5 Flash - -
Google Gemini 2.5 Flash-Lite - -
Meta Llama 4 Maverick d

Grande Genérico 2

-
Meta Llama 4 Escoteiro d

Grande Genérico V2

-
Meta Llama 3.3 70B (Padrão) d

Grande Genérico

-
Meta Llama 3.3 70B (Dinâmico FP8) - d

LARGE_GENERIC_V1

Meta Llama 3.2 90B d

Grande Genérico V2

-
Meta Llama 3.2 11B Visão - -
Meta Llama 3.1 405B - -
Meta Llama 3.1 70B - -
Meta Llama 3 70B - -
OpenAI gpt-oss-120b d

OAI_H200_X1

d

OAI_A100_40G_X1

OpenAI gpt-oss-20b d

OAI_H200_X1

d

OAI_A10_X2

OAI_A100_40G_X1

xAI Grok 4.20 Multiagente - -
xAI Grok 4.20 - -
Código Grok xAI Rápido 1 - -
xAI Grok 4.1 Rápido - -
xAI Grok 4 Rápido - -
xAI Grok 4 - -
xAI Grok 3 - -
xAI Grok 3 Mini - -
xAI Grok 3 Rápido - -
xAI Grok 3 Mini Rápido - -

Ásia-Pacífico (AP)

Nome do Modelo Sul da Índia (Hyderabad)

(OC1)

Centro do Japão (Osaka)

(OC1)

Observações
Comando Cohere Um Raciocínio d

LARGE_COHERE_V2_2

d

LARGE_COHERE_V2_2

-
Comando Cohere Uma Visão d

LARGE_COHERE_V3

d

LARGE_COHERE_V3

-
Comando Cohere A

LARGE_COHERE_V3

LARGE_COHERE_V3

-
Comando Cohere R (08-2024) -

Cohere Leve V2

-
Comando R+ da Cohere (08-2024) -

Modelo Cohere de Alto Desempenho V2_2

-
Comando Cohere R 16K - d

Cohere Leve V2

-
Comando R+ Cohere (Retirado) - - -
Cohere Embed 4 d

Incorporar Cohere

Incorporar Cohere

-
Cohere Incorporar Imagem em Inglês 3 - d

Incorporar Cohere

-
Cohere incorpora a imagem clara inglesa 3 - d

Incorporar Cohere

-
Cohere Incorporar Imagem Multilíngue 3

Incorporar Cohere

d

Incorporar Cohere

-
Cohere Incorporar Imagem de Luz Multilíngue 3 - d

Incorporar Cohere

-
Cohere Embed Inglês 3 -

Incorporar Cohere

-
Cohere Embed Inglês Luz 3 - -

Incorporar Cohere

-
Cohere Embed Multilíngue 3 - -
Cohere Embed Luz Multilíngue 3 - - -
Cohere Rerank 3.5 - d

RERANK_COHERE

-
Google Gemini 2.5 Pro - o Consulte Chamadas Externas.
Google Gemini 2.5 Flash o o Consulte Chamadas Externas.
Google Gemini 2.5 Flash-Lite - - -
Meta Llama 4 Maverick d

Grande Genérico 2

d

Grande Genérico 2

-
Meta Llama 4 Escoteiro d

Grande Genérico V2

d

Grande Genérico V2

-
Meta Llama 3.3 70B (Padrão) d

Grande Genérico

Grande Genérico

-
Meta Llama 3.3 70B (Dinâmico FP8) d

Grande Genérico

Grande Genérico

-
Meta Llama 3.2 90B -

Grande Genérico V2

-
Meta Llama 3.2 11B Visão - d

Pequeno Genérico V2

-
Meta Llama 3.1 405B - d

Grande Genérico 2

-
Meta Llama 3.1 70B -

Grande Genérico

-
Meta Llama 3 70B - - -
OpenAI gpt-oss-120b d

OAI_H100_X2

OAI_H100_X2

-
OpenAI gpt-oss-20b d

OAI_H100_X1

OAI_H100_X1

-
xAI Grok 4.20 Multiagente - - -
xAI Grok 4.20 - - -
Código Grok xAI Rápido 1 - - -
xAI Grok 4.1 Rápido - - -
xAI Grok 4 Rápido - - -
xAI Grok 4 - - -
xAI Grok 3 - - -
xAI Grok 3 Mini - - -
xAI Grok 3 Rápido - - -
xAI Grok 3 Mini Rápido - - -

Notas para chamadas externas

Modelos do Google

Importante

Chamadas Externas para Google Gemini 2.5 Pro em Regiões dos EUA

O modelo Google Gemini 2.5 Pro que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Google Gemini 2.5 Pro (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Google Gemini 2.5 Pro, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.

Importante

Chamadas Externas para Google Gemini 2.5 Pro para Regiões da UE

O modelo Google Gemini 2.5 Pro que pode ser acessado por meio do serviço OCI Generative AI na região de Frankfurt é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Google Gemini 2.5 Pro (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Pro, é usada uma localização regional da União Europeia (UE) do Google, que encaminha a solicitação para apenas uma localização da UE do Google. O Processamento de Aprendizado de Máquina ocorre em um local do Google EU.

Importante

Chamadas Externas para Google Gemini 2.5 Pro para Regiões do AP

O modelo Google Gemini 2.5 Pro que pode ser acessado por meio do serviço OCI Generative AI na região de Osaka é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Google Gemini 2.5 Pro (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Pro, é usado um local regional do Google Ásia-Pacífico, que encaminha a solicitação para apenas um local do Google Ásia-Pacífico. O Processamento de Aprendizado de Máquina pode ocorrer em qualquer local do Google globalmente.

Importante

Chamadas Externas para Gemini 2.5 Flash em Regiões dos EUA

O modelo Gemini 2.5 Flash que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Gemini 2.5 Flash (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Flash, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.

Importante

Chamadas Externas para Gemini 2.5 Flash para Regiões da UE

O modelo Gemini 2.5 Flash que pode ser acessado por meio do serviço OCI Generative AI na região de Frankfurt é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Gemini 2.5 Flash (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Flash, é usada uma localização regional da União Europeia (UE) do Google, que encaminha a solicitação para apenas uma localização da UE do Google. O Processamento de Aprendizado de Máquina ocorre em um local do Google EU.

Importante

Chamadas Externas para Gemini 2.5 Flash para Regiões do AP

O modelo Gemini 2.5 Flash que pode ser acessado por meio do serviço OCI Generative AI na região de Osaka e Hyderabad é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Gemini 2.5 Flash (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Flash, é usado um local regional do Google Ásia-Pacífico, que encaminha a solicitação para apenas um local do Google Ásia-Pacífico. O Processamento de Aprendizado de Máquina pode ocorrer em qualquer local do Google globalmente.

Importante

Chamadas Externas para Gemini 2.5 Flash-Lite em Regiões dos EUA

O modelo Gemini 2.5 Flash-Lite que pode ser acessado por meio do serviço OCI Generative AI nas regiões dos EUA é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Gemini 2.5 Flash-Lite (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Flash-Lite, é usado um local regional do Google Americas, que roteia a solicitação para apenas um local do Google Americas. O Processamento de Aprendizado de Máquina ocorre em um local do Google Americas.

Importante

Chamadas Externas para Gemini 2.5 Flash-Lite para Regiões da UE

O modelo Gemini 2.5 Flash-Lite que pode ser acessado por meio do serviço OCI Generative AI na região de Frankfurt é hospedado externamente pelo Google. Portanto, uma chamada para um modelo Gemini 2.5 Flash-Lite (por meio do serviço OCI Generative AI) resulta em uma chamada para um local do Google. Para Gemini 2.5 Pro, é usada uma localização regional da União Europeia (UE) do Google, que encaminha a solicitação para apenas uma localização da UE do Google. O Processamento de Aprendizado de Máquina ocorre em um local do Google EU.

modelos de xAI

Importante

Chamadas Externas para Modelos Grok xAI

Os modelos xAI Grok são hospedados em um data center da OCI, em uma tenancy provisionada para xAI. Os modelos xAI Grok, que podem ser acessados por meio do serviço OCI Generative AI, são gerenciados pelo xAI.