Modelos Alibaba compatíveis

Você pode importar grandes modelos de linguagem de buckets do Hugging Face e do OCI Object Storage para o OCI Generative AI, criar pontos finais para esses modelos e usá-los no serviço Generative AI.

A família de modelos Alibaba Qwen possui capacidades multilíngues e multimodais avançadas. Para cartões de modelo no Hugging Face, consulte os links nas tabelas a seguir.

Qwen 3 Next

Modelo Qwen 3 Next Compatível
Abraçando o ID do modelo facial	Capacidade do Modelo	Forma Recomendada da Unidade de Cluster de IA Dedicada
Qwen/Qwen3-Next-80B-A3B-Instruct	TEXT_TO_TEXT	A100_80G_X4 H100_X4 H200_X4

Qwen 3.6

Modelo Qwen 3.6 Compatível
Abraçando o ID do modelo facial	Capacidade do Modelo	Forma Recomendada da Unidade de Cluster de IA Dedicada
Qwen/Qwen3.6-35B-A3B	IMAGE_TEXT_TO_TEXT	A100_80GB_X2 H100_X2 H200_X2 B200_X2

Qwen 3.5

Modelo Qwen 3.5 Compatível
Abraçando o ID do modelo facial	Capacidade do Modelo	Forma Recomendada da Unidade de Cluster de IA Dedicada
Qwen/Qwen3.5-9B	IMAGE_TEXT_TO_TEXT	A100_80GB_X1 H100_X1 H200_X1 B200_X1

Qwen Imagem

Modelos Qwen Image Compatíveis
Abraçando o ID do modelo facial	Capacidade do Modelo	Forma Recomendada da Unidade de Cluster de IA Dedicada
Qwen/Qwen-Imagem	TEXT_TO_IMAGE	A100_80G_X1
Qwen/Qwen-Imagem-Editar	IMAGE_TEXT_TO_IMAGE	A100_80G_X1
Qwen/Qwen-Imagem-2512	TEXT_TO_IMAGE	A100_80G_X1
Qwen/Qwen-Imagem-Edição-2511	IMAGE_TEXT_TO_IMAGE	A100_80G_X1
Qwen/Qwen-Imagem-Edição-2509	IMAGE_TEXT_TO_IMAGE	A100_80G_X1

Observação

response_format: "url" não funciona e retorna um erro de solicitação inválida HTTP 400.
n (número de imagens): somente 0 ou 1 funcionam.
O streaming não é compatível.
Tamanhos de imagem não padrão podem ser arredondados (por exemplo, 999x999 → 992x992) em vez de retornar um HTTP 400 (ao contrário da API OpenAI).
A transparência pode não funcionar por causa das limitações do modelo.

Qwen Q (Razão)

Modelos Qwen Q Compatíveis
Abraçando o ID do modelo facial	Capacidade do Modelo	Forma Recomendada da Unidade de Cluster de IA Dedicada
Qwen/QwQ-32B	TEXT_TO_TEXT	A100_80G_X2

Qwen 3

Modelos Qwen 3 Compatíveis
Abraçando o ID do modelo facial	Capacidade do Modelo	Forma Recomendada da Unidade de Cluster de IA Dedicada
Qwen/Qwen3-Incorporação-0.6B	INCORPORAÇÃO	A10_X1
Qwen/Qwen3-Incorporação-4B	INCORPORAÇÃO	A10_X2
Qwen/Qwen3-Incorporação-8B	INCORPORAÇÃO	A100_80G_X1
Qwen/Qwen3-0.6B	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen3-1.7B	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen3-4B	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen3-8B	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen3-14B	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen3-32B	TEXT_TO_TEXT	A100_80G_X2
Qwen/Qwen3-4B-Instruct-2507	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen3-30B-A3B-Instruct-2507	TEXT_TO_TEXT	A100_80G_X2
Qwen/Qwen3-235B-A22B-Instruct-2507	TEXT_TO_TEXT	H100_X8
Qwen/Qwen3-VL-30B-A3B-Instrução	IMAGE_TEXT_TO_TEXT	H100_X2
Qwen/Qwen3-VL-30B-A3B-Instruct-FP8	IMAGE_TEXT_TO_TEXT	H100_X2 H200_X2
Qwen/Qwen3-VL-235B-A22B-Instrução	IMAGE_TEXT_TO_TEXT	H100_X8

Qwen 2.5

Modelos Qwen2.5 Compatíveis
Abraçando o ID do modelo facial	Capacidade do Modelo	Forma Recomendada da Unidade de Cluster de IA Dedicada
Qwen/Qwen2.5-Coder-32B-Instruct	TEXT_TO_TEXT	A100_80G_X2
Qwen/Qwen2.5-0.5B-Instrução	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-1.5B-Instrução	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-3B-Instrução	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-7B-Instrução	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-14B-Instrução	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-32B-Instrução	TEXT_TO_TEXT	A100_80G_X2
Qwen/Qwen2.5-72B-Instrução	TEXT_TO_TEXT	A100_80G_X4
Qwen/Qwen2.5-VL-3B-Instrução	IMAGE_TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-VL-7B-Instrução	IMAGE_TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-VL-32B-Instrução	IMAGE_TEXT_TO_TEXT	A100_80G_X2
Qwen/Qwen2.5-VL-72B-Instrução	IMAGE_TEXT_TO_TEXT	A100_80G_X4

Qwen 2

Modelos Qwen2 Compatíveis
Abraçando o ID do modelo facial	Capacidade do Modelo	Forma Recomendada da Unidade de Cluster de IA Dedicada
Qwen/Qwen2-0.5B-Instrução	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2-1.5B-Instrução	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2-7B-Instrução	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2-72B-Instrução	TEXTO_PARA_TEXTO	A100_80G_X4
Qwen/Qwen2-VL-2B-Instrução	IMAGEM_TEXTO_PARA_TEXTO	A100_80G_X1
Qwen/Qwen2-VL-7B-Instrução	IMAGEM_TEXTO_PARA_TEXTO	A100_80G_X1
Qwen/Qwen2-VL-72B-Instrução	IMAGEM_TEXTO_PARA_TEXTO	A100_80G_X4

Importante

Para modelos importados, você pode usar o tamanho do contexto nativo especificado pelo provedor do modelo. No entanto, o tamanho máximo de contexto efetivo é limitado pela configuração de hardware subjacente que você seleciona para hospedar clusters de IA dedicados na OCI Generative AI. Para aproveitar ao máximo o tamanho do contexto nativo de um modelo, talvez seja necessário provisionar mais recursos de hardware.
Use os modelos ajustados somente se eles corresponderem à versão do transformador do modelo base compatível e tiverem uma contagem de parâmetros dentro de ± 10% do original.
Para obter o hardware disponível e as etapas sobre como implantar os modelos importados, consulte Gerenciando Modelos Importados.

Documentação do Oracle Cloud Infrastructure