Modèles Alibaba compatibles

Vous pouvez importer de grands modèles de langage à partir de seaux de stockage d'objets Hugging Face et OCI dans le service d'intelligence artificielle générative pour OCI, créer des points d'extrémité pour ces modèles et les utiliser dans le service d'intelligence artificielle générative.

La famille de modèles Alibaba Qwen offre des fonctionnalités multilingues et multimodales avancées. Pour les cartes modèles sur Hugging Face, voir les liens dans les tableaux suivants.

Qwen 3 Next

Modèle Qwen 3 Next compatible
ID modèle de visage Hugging	Capacité du modèle	Forme d'unité de grappe dédiée à l'IA recommandée
Qwen/Qwen3-Suivant-80B-A3B-Instruction	TEXT_TO_TEXT	A100_80G_X4 H100_X4 — H200_X4 —

Qwen 3.6

Modèle Qwen 3.6 compatible
ID modèle de visage Hugging	Capacité du modèle	Forme d'unité de grappe dédiée à l'IA recommandée
Qwen/Qwen3.6-35B-A3B	IMAGE_TEXT_TO_TEXT	A100_80GB_X2; H100_X2 H200_X2; B200_X2;

Qwen 3.5

Modèle Qwen 3.5 compatible
ID modèle de visage Hugging	Capacité du modèle	Forme d'unité de grappe dédiée à l'IA recommandée
Qwen/Qwen3,5-9B	IMAGE_TEXT_TO_TEXT	A100_80GB_X1; H100_X1 — H200_X1 — B200_X1;

Image de Qwen

Modèles Qwen Image compatibles
ID modèle de visage Hugging	Capacité du modèle	Forme d'unité de grappe dédiée à l'IA recommandée
Qwen/Qwen-Image	TEXT_TO_IMAGE	A100_80G_X1
Qwen/Qwen-Image-Modifier	IMAGE_TEXT_TO_IMAGE	A100_80G_X1
Qwen/Qwen-Image-2512	TEXT_TO_IMAGE	A100_80G_X1
Qwen/Qwen-Image-Edit-2511	IMAGE_TEXT_TO_IMAGE	A100_80G_X1
Qwen/Qwen-Image-Edit-2509	IMAGE_TEXT_TO_IMAGE	A100_80G_X1

Note

response_format: "url" ne fonctionne pas et retourne une erreur de demande incorrecte HTTP 400.
n (nombre d'images) : seul 0 ou 1 fonctionne.
La diffusion en continu n'est pas compatible.
Les tailles d'image non standard peuvent être arrondies (par exemple, 999x999 → 992x992) au lieu de retourner un HTTP 400 (contrairement à l'API OpenAI).
La transparence peut ne pas fonctionner en raison des limitations du modèle.

Qwen Q (Motif)

Modèles Qwen Q compatibles
ID modèle de visage Hugging	Capacité du modèle	Forme d'unité de grappe dédiée à l'IA recommandée
Qwen/QwQ-32B	TEXT_TO_TEXT	A100_80G_X2

Qwen 3

Modèles Qwen 3 compatibles
ID modèle de visage Hugging	Capacité du modèle	Forme d'unité de grappe dédiée à l'IA recommandée
Qwen/Qwen3-Intégration-0.6B	INTÉGRATION	A10_X1
Qwen/Qwen3-Intégration-4B	INTÉGRATION	A10_X2
Qwen/Qwen3-Intégration-8B	INTÉGRATION	A100_80G_X1
Qwen/Qwen3-0.6B	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen3-1.7B	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen3-4B	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen3-8B	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen3-14B	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen3-32B	TEXT_TO_TEXT	A100_80G_X2
Qwen/Qwen3-4B-Instruction-2507	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen3-30B-A3B-Instruction-2507	TEXT_TO_TEXT	A100_80G_X2
Qwen/Qwen3-235B-A22B-Instruction-2507	TEXT_TO_TEXT	H100_X8
Qwen/Qwen3-VL-30B-A3B-Instruction	IMAGE_TEXT_TO_TEXT	H100_X2 —
Qwen/Qwen3-VL-30B-A3B-Instruct-FP8	IMAGE_TEXT_TO_TEXT	H100_X2 — H200_X2;
Qwen/Qwen3-VL-235B-A22B-Instruction	IMAGE_TEXT_TO_TEXT	H100_X8

Qwen 2,5

Modèles Qwen2.5 compatibles
ID modèle de visage Hugging	Capacité du modèle	Forme d'unité de grappe dédiée à l'IA recommandée
Qwen/Qwen2.5-Coder-32B-Instruction	TEXT_TO_TEXT	A100_80G_X2
Qwen/Qwen2.5-0.5B-Instruction	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-1.5B-Instruction	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-3B-Instruction	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-7B-Instruction	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-14B-Instruction	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-32B-Instruction	TEXT_TO_TEXT	A100_80G_X2
Qwen/Qwen2.5-72B-Instruction	TEXT_TO_TEXT	A100_80G_X4
Qwen/Qwen2.5-VL-3B-Instruction	IMAGE_TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-VL-7B-Instruction	IMAGE_TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-VL-32B-Instruction	IMAGE_TEXT_TO_TEXT	A100_80G_X2
Qwen/Qwen2.5-VL-72B-Instruction	IMAGE_TEXT_TO_TEXT	A100_80G_X4

Qwen 2

Modèles Qwen2 compatibles
ID modèle de visage Hugging	Capacité du modèle	Forme d'unité de grappe dédiée à l'IA recommandée
Qwen/Qwen2-0.5B-Instruction	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2-1.5B-Instruction	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2-7B-Instruction	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2-72B-Instruction	TEXTE_TO_TEXT	A100_80G_X4
Qwen/Qwen2-VL-2B-Instruction	IMAGE_TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2-VL-7B-Instruction	IMAGE_TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2-VL-72B-Instruction	IMAGE_TEXT_TO_TEXT	A100_80G_X4;

Important

Pour les modèles importés, vous pouvez utiliser la longueur du contexte natif spécifiée par le fournisseur de modèle. Toutefois, la longueur de contexte maximale en vigueur est limitée par la configuration matérielle sous-jacente que vous sélectionnez pour les grappes d'IA dédiées à l'hébergement dans l'IA générative OCI. Pour tirer pleinement parti de la longueur du contexte natif d'un modèle, vous devrez peut-être provisionner davantage de ressources matérielles.
Utilisez les modèles affinés uniquement s'ils correspondent à la version du transformateur du modèle de base compatible et ont un nombre de paramètres inférieur à ± 10 % de l'original.
Pour le matériel disponible et les étapes de déploiement des modèles importés, voir Gestion des modèles importés.

Documentation sur Oracle Cloud Infrastructure