Modèles Alibaba validés

Vous pouvez importer de grands modèles de langage à partir de seaux de stockage d'objets Hugging Face et OCI dans le service d'intelligence artificielle générative pour OCI, créer des points d'extrémité pour ces modèles et les utiliser dans le service d'intelligence artificielle générative.

La famille de modèles Alibaba Qwen offre des fonctionnalités multilingues et multimodales avancées. Pour les cartes modèles sur Hugging Face, voir les liens dans les tableaux suivants.

Image de Qwen

Modèles Qwen Image validés
ID modèle de visage Hugging Capacité du modèle Forme d'unité de grappe dédiée à l'IA recommandée
Qwen/Qwen-Image TEXT_TO_IMAGE A100_80G_X1
Qwen/Qwen-Image-Modifier IMAGE_TEXT_TO_IMAGE A100_80G_X1
Qwen/Qwen-Image-2512 TEXT_TO_IMAGE A100_80G_X1
Qwen/Qwen-Image-Edit-2511 IMAGE_TEXT_TO_IMAGE A100_80G_X1
Qwen/Qwen-Image-Edit-2509 IMAGE_TEXT_TO_IMAGE A100_80G_X1
Note

  • response_format: "url" ne fonctionne pas et retourne une erreur de demande incorrecte HTTP 400.
  • n (nombre d'images) : seul 0 ou 1 fonctionne.
  • La diffusion en continu n'est pas validée.
  • Les tailles d'image non standard peuvent être arrondies (par exemple, 999x999992x992) au lieu de retourner un HTTP 400 (contrairement à l'API OpenAI).
  • La transparence peut ne pas fonctionner en raison des limitations du modèle.

Qwen Q (Motif)

Modèles Qwen Q validés
ID modèle de visage Hugging Capacité du modèle Forme d'unité de grappe dédiée à l'IA recommandée
Qwen/QwQ-32B TEXT_TO_TEXT A100_80G_X2

Qwen 3

Modèles Qwen 3 validés
ID modèle de visage Hugging Capacité du modèle Forme d'unité de grappe dédiée à l'IA recommandée
Qwen/Qwen3-Intégration-0.6B INTÉGRATION A10_X1
Qwen/Qwen3-Intégration-4B INTÉGRATION A10_X2
Qwen/Qwen3-Intégration-8B INTÉGRATION A100_80G_X1
Qwen/Qwen3-0.6B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-1.7B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-4B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-8B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-14B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-32B TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen3-4B-Instruction-2507 TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-30B-A3B-Instruction-2507 TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen3-235B-A22B-Instruction-2507 TEXT_TO_TEXT H100_X8
Qwen/Qwen3-VL-30B-A3B-Instruction IMAGE_TEXT_TO_TEXT H100_X2
Qwen/Qwen3-VL-235B-A22B-Instruction IMAGE_TEXT_TO_TEXT H100_X8

Qwen 2,5

Modèles Qwen2.5 validés
ID modèle de visage Hugging Capacité du modèle Forme d'unité de grappe dédiée à l'IA recommandée
Qwen/Qwen2.5-Coder-32B-Instruction TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen2.5-0.5B-Instruction TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-1.5B-Instruction TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-3B-Instruction TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-7B-Instruction TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-14B-Instruction TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-32B-Instruction TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen2.5-72B-Instruction TEXT_TO_TEXT A100_80G_X4
Qwen/Qwen2.5-VL-3B-Instruction IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-VL-7B-Instruction IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-VL-32B-Instruction IMAGE_TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen2.5-VL-72B-Instruction IMAGE_TEXT_TO_TEXT A100_80G_X4

Qwen 2

Modèles Qwen2 validés
ID modèle de visage Hugging Capacité du modèle Forme d'unité de grappe dédiée à l'IA recommandée
Qwen/Qwen2-0.5B-Instruction TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-1.5B-Instruction TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-7B-Instruction TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-72B-Instruction TEXT_TO_TEXT A100_80G_X4
Qwen/Qwen2-VL-2B-Instruction IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-VL-7B-Instruction IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-VL-72B-Instruction IMAGE_TEXT_TO_TEXT A100_80G_X4
Important

  • Bien que vous puissiez importer n'importe quel modèle de clavardage, d'intégration (et de réglage fin) validé au moyen d'Open Model Engine (avec l'exécution vLLM ou SGLang), seuls les modèles explicitement répertoriés dans cette page sont validés pour cette famille de modèles. Les modèles non listés peuvent présenter des problèmes de compatibilité et nous vous recommandons de tester tout modèle non listé avant l'utilisation en production. En savoir plus sur l'architecture de modèle importée par l'intelligence artificielle générative pour OCI.

  • Pour les modèles importés, vous pouvez utiliser la longueur du contexte natif spécifiée par le fournisseur de modèle. Toutefois, la longueur de contexte maximale en vigueur est limitée par la configuration matérielle sous-jacente que vous sélectionnez pour les grappes d'IA dédiées à l'hébergement dans l'IA générative OCI. Pour tirer pleinement parti de la longueur du contexte natif d'un modèle, vous devrez peut-être provisionner davantage de ressources matérielles.
  • Utilisez les modèles affinés uniquement s'ils correspondent à la version du transformateur du modèle de base validé et ont un nombre de paramètres inférieur à ± 10 % de l'original.
  • Pour le matériel disponible et les étapes de déploiement des modèles importés, voir Gestion des modèles importés.
  • Si la forme d'unité validée n'est pas disponible dans la région, sélectionnez une option de niveau supérieur. Par exemple, si A100 n'est pas disponible, sélectionnez H100.