Modelos de Alibaba soportados

Puede importar modelos de lenguaje grandes de cubos de Hugging Face y OCI Object Storage a OCI Generative AI, crear puntos finales para esos modelos y utilizarlos en el servicio Generative AI.

La familia de modelos Alibaba Qwen cuenta con capacidades multilingües y multimodales avanzadas. Consulte Qwen2, Qwen2 VL, Qwen2.5 VL, Qwen3, Qwen3 VL en la documentación de Hugging Face.

Qwen 3

Modelos Qwen3 soportados
ID de modelo facial de abrazo Capacidad del modelo Unidad de cluster de IA dedicada recomendada
Qwen/Qwen3-0.6B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-1.7B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-4B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-8B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-14B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-32B TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen3-4B-Instruct-2507 TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-30B-A3B-Instruct-2507 TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen3-235B-A22B-Instruct-2507 TEXT_TO_TEXT H100_X8
Qwen/Qwen3-VL-30B-A3B-Instruct IMAGE_TEXT_TO_TEXT H100_X2
Qwen/Qwen3-VL-235B-A22B-Instruct IMAGE_TEXT_TO_TEXT H100_X8

Qwen 2

Modelos Qwen2 soportados
ID de modelo facial de abrazo Capacidad del modelo Unidad de cluster de IA dedicada recomendada
Qwen/Qwen2-0.5B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-1.5B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-7B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-72B-Instruct TEXT_TO_TEXT A100_80G_X4
Qwen/Qwen2-VL-2B-Instruct IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-VL-7B-Instruct IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-VL-72B-Instruct IMAGE_TEXT_TO_TEXT A100_80G_X4
Qwen/Qwen2.5-0.5B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-1.5B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-3B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-7B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-14B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-32B-Instruct TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen2.5-72B-Instruct TEXT_TO_TEXT A100_80G_X4
Qwen/Qwen2.5-VL-3B-Instruct IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-VL-7B-Instruct IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-VL-32B-Instruct IMAGE_TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen2.5-VL-72B-Instruct IMAGE_TEXT_TO_TEXT A100_80G_X4
Nota

  • Para importar una versión ajustada de un modelo, solo se admiten los modelos ajustados que utilizan la misma versión de transformadores que el modelo original y tienen un recuento de parámetros dentro del ±10% del original.
  • Si el tipo de instancia de la unidad recomendada no está disponible en la región, seleccione una instancia de nivel superior (por ejemplo, seleccione una unidad H100 en lugar de una unidad A100-80G).
  • Para conocer los requisitos previos y cómo importar modelos, consulte Gestión de modelos importados (nuevos).