Modelos Alibaba compatíveis

Você pode importar grandes modelos de linguagem de buckets do Hugging Face e do OCI Object Storage para o OCI Generative AI, criar pontos finais para esses modelos e usá-los no serviço Generative AI.

A família de modelos Alibaba Qwen possui capacidades multilíngues e multimodais avançadas. Para cartões de modelo no Hugging Face, consulte os links nas tabelas a seguir.

Qwen Imagem

Modelos Qwen Image Compatíveis
Abraçando o ID do modelo facial Capacidade do Modelo Forma Recomendada da Unidade de Cluster de IA Dedicada
Qwen/Qwen-Imagem TEXT_TO_IMAGE A100_80G_X1
Qwen/Qwen-Imagem-Editar IMAGE_TEXT_TO_IMAGE A100_80G_X1
Qwen/Qwen-Imagem-2512 TEXT_TO_IMAGE A100_80G_X1
Qwen/Qwen-Imagem-Edição-2511 IMAGE_TEXT_TO_IMAGE A100_80G_X1
Qwen/Qwen-Imagem-Edição-2509 IMAGE_TEXT_TO_IMAGE A100_80G_X1
Observação

  • response_format: "url" não funciona e retorna um erro de solicitação inválida HTTP 400.
  • n (número de imagens): somente 0 ou 1 funcionam.
  • O streaming não é compatível.
  • Tamanhos de imagem não padrão podem ser arredondados (por exemplo, 999x999992x992) em vez de retornar um HTTP 400 (ao contrário da API OpenAI).
  • A transparência pode não funcionar por causa das limitações do modelo.

Qwen Q (Razão)

Modelos Qwen Q Compatíveis
Abraçando o ID do modelo facial Capacidade do Modelo Forma Recomendada da Unidade de Cluster de IA Dedicada
Qwen/QwQ-32B TEXT_TO_TEXT A100_80G_X2

Qwen 3

Modelos Qwen 3 Compatíveis
Abraçando o ID do modelo facial Capacidade do Modelo Forma Recomendada da Unidade de Cluster de IA Dedicada
Qwen/Qwen3-Incorporação-0.6B INCORPORAÇÃO A10_X1
Qwen/Qwen3-Incorporação-4B INCORPORAÇÃO A10_X2
Qwen/Qwen3-Incorporação-8B INCORPORAÇÃO A100_80G_X1
Qwen/Qwen3-0.6B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-1.7B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-4B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-8B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-14B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-32B TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen3-4B-Instruct-2507 TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-30B-A3B-Instruct-2507 TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen3-235B-A22B-Instruct-2507 TEXT_TO_TEXT H100_X8
Qwen/Qwen3-VL-30B-A3B-Instrução IMAGE_TEXT_TO_TEXT H100_X2
Qwen/Qwen3-VL-235B-A22B-Instrução IMAGE_TEXT_TO_TEXT H100_X8

Qwen 2.5

Modelos Qwen2.5 Compatíveis
Abraçando o ID do modelo facial Capacidade do Modelo Forma Recomendada da Unidade de Cluster de IA Dedicada
Qwen/Qwen2.5-Coder-32B-Instruct TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen2.5-0.5B-Instrução TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-1.5B-Instrução TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-3B-Instrução TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-7B-Instrução TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-14B-Instrução TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-32B-Instrução TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen2.5-72B-Instrução TEXT_TO_TEXT A100_80G_X4
Qwen/Qwen2.5-VL-3B-Instrução IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-VL-7B-Instrução IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-VL-32B-Instrução IMAGE_TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen2.5-VL-72B-Instrução IMAGE_TEXT_TO_TEXT A100_80G_X4

Qwen 2

Modelos Qwen2 Compatíveis
Abraçando o ID do modelo facial Capacidade do Modelo Forma Recomendada da Unidade de Cluster de IA Dedicada
Qwen/Qwen2-0.5B-Instrução TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-1.5B-Instrução TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-7B-Instrução TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-72B-Instrução TEXT_TO_TEXT A100_80G_X4
Qwen/Qwen2-VL-2B-Instrução IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-VL-7B-Instrução IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-VL-72B-Instrução IMAGE_TEXT_TO_TEXT A100_80G_X4
Importante

  • Embora você possa importar qualquer modelo de chat, incorporação (e ajuste fino) validado por meio do Open Model Engine (com runtime vLLM ou SGLang), apenas os modelos listados explicitamente nesta página foram avaliados para essa família de modelos pela Oracle em relação aos tempos de execução do modelo de código-fonte aberto e testados nas configurações de GPU suportadas pela Oracle. Não obstante o precedente, a Oracle não é responsável por nenhum problema relacionado ao desempenho, disponibilidade, operação ou segurança dos Modelos Compatíveis. Modelos não listados podem ter problemas de compatibilidade e recomendamos que você teste qualquer modelo não listado antes do uso da produção. Saiba mais sobre a OCI Generative AI Imported Model Architecture.

  • Para modelos importados, você pode usar o tamanho do contexto nativo especificado pelo provedor do modelo. No entanto, o tamanho máximo de contexto efetivo é limitado pela configuração de hardware subjacente que você seleciona para hospedar clusters de IA dedicados na OCI Generative AI. Para aproveitar ao máximo o tamanho do contexto nativo de um modelo, talvez seja necessário provisionar mais recursos de hardware.
  • Use os modelos ajustados somente se eles corresponderem à versão do transformador do modelo base compatível e tiverem uma contagem de parâmetros dentro de ± 10% do original.
  • Para obter o hardware disponível e as etapas sobre como implantar os modelos importados, consulte Gerenciando Modelos Importados.
  • Se a forma de unidade compatível não estiver disponível na região, selecione uma opção de camada superior. Por exemplo, se a A100 não estiver disponível, selecione H100.