Modèles Alibaba pris en charge
Vous pouvez importer de grands modèles de langage à partir de seaux de stockage d'objets Hugging Face et OCI dans le service d'intelligence artificielle générative pour OCI, créer des points d'extrémité pour ces modèles et les utiliser dans le service d'intelligence artificielle générative.
La famille de modèles Alibaba Qwen offre des fonctionnalités multilingues et multimodales avancées. Pour les cartes modèles sur Hugging Face, voir les liens dans les tableaux suivants.
Image de Qwen
| ID modèle de visage Hugging | Capacité du modèle | Forme d'unité de grappe dédiée à l'IA recommandée |
|---|---|---|
| Qwen/Qwen-Image | TEXT_TO_IMAGE | A100_80G_X1 |
| Qwen/Qwen-Image-Modifier | IMAGE_TEXT_TO_IMAGE | A100_80G_X1 |
| Qwen/Qwen-Image-2512 | TEXT_TO_IMAGE | A100_80G_X1 |
| Qwen/Qwen-Image-Edit-2511 | IMAGE_TEXT_TO_IMAGE | A100_80G_X1 |
| Qwen/Qwen-Image-Edit-2509 | IMAGE_TEXT_TO_IMAGE | A100_80G_X1 |
response_format: "url"n'est pas pris en charge (HTTP 400).n(nombre d'images) : seul0ou1est pris en charge.- La diffusion en continu n'est pas prise en charge.
- Les tailles d'image non standard peuvent être arrondies (par exemple,
999x999→992x992) au lieu de retourner HTTP 400 (contrairement à l'API OpenAI). - La transparence n'est pas garantie en raison des limitations du modèle.
Qwen Q (Motif)
| ID modèle de visage Hugging | Capacité du modèle | Forme d'unité de grappe dédiée à l'IA recommandée |
|---|---|---|
| Qwen/QwQ-32B | TEXT_TO_TEXT | A100_80G_X2 |
Qwen 3
| ID modèle de visage Hugging | Capacité du modèle | Forme d'unité de grappe dédiée à l'IA recommandée |
|---|---|---|
| Qwen/Qwen3-Intégration-0.6B | INTÉGRATION | A10_X1 |
| Qwen/Qwen3-Intégration-4B | INTÉGRATION | A10_X2 |
| Qwen/Qwen3-Intégration-8B | INTÉGRATION | A100_80G_X1 |
| Qwen/Qwen3-0.6B | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen3-1.7B | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen3-4B | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen3-8B | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen3-14B | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen3-32B | TEXT_TO_TEXT | A100_80G_X2 |
| Qwen/Qwen3-4B-Instruction-2507 | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen3-30B-A3B-Instruction-2507 | TEXT_TO_TEXT | A100_80G_X2 |
| Qwen/Qwen3-235B-A22B-Instruction-2507 | TEXT_TO_TEXT | H100_X8 |
| Qwen/Qwen3-VL-30B-A3B-Instruction | IMAGE_TEXT_TO_TEXT | H100_X2 |
| Qwen/Qwen3-VL-235B-A22B-Instruction | IMAGE_TEXT_TO_TEXT | H100_X8 |
Qwen 2,5
| ID modèle de visage Hugging | Capacité du modèle | Forme d'unité de grappe dédiée à l'IA recommandée |
|---|---|---|
| Qwen/Qwen2.5-Coder-32B-Instruction | TEXT_TO_TEXT | A100_80G_X2 |
| Qwen/Qwen2.5-0.5B-Instruction | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2.5-1.5B-Instruction | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2.5-3B-Instruction | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2.5-7B-Instruction | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2.5-14B-Instruction | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2.5-32B-Instruction | TEXT_TO_TEXT | A100_80G_X2 |
| Qwen/Qwen2.5-72B-Instruction | TEXT_TO_TEXT | A100_80G_X4 |
| Qwen/Qwen2.5-VL-3B-Instruction | IMAGE_TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2.5-VL-7B-Instruction | IMAGE_TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2.5-VL-32B-Instruction | IMAGE_TEXT_TO_TEXT | A100_80G_X2 |
| Qwen/Qwen2.5-VL-72B-Instruction | IMAGE_TEXT_TO_TEXT | A100_80G_X4 |
Qwen 2
| ID modèle de visage Hugging | Capacité du modèle | Forme d'unité de grappe dédiée à l'IA recommandée |
|---|---|---|
| Qwen/Qwen2-0.5B-Instruction | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2-1.5B-Instruction | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2-7B-Instruction | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2-72B-Instruction | TEXT_TO_TEXT | A100_80G_X4 |
| Qwen/Qwen2-VL-2B-Instruction | IMAGE_TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2-VL-7B-Instruction | IMAGE_TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2-VL-72B-Instruction | IMAGE_TEXT_TO_TEXT | A100_80G_X4 |
-
Bien que vous puissiez importer n'importe quel modèle de clavardage, d'intégration (et de réglage fin) pris en charge par Open Model Engine (avec l'exécution vLLM ou SGLang), seuls les modèles explicitement répertoriés dans cette page sont pris en charge pour cette famille de modèles. Les modèles non listés peuvent présenter des problèmes de compatibilité et nous vous recommandons de tester tout modèle non listé avant l'utilisation en production. En savoir plus sur l'architecture de modèle importée par l'intelligence artificielle générative pour OCI.
- Les modèles importés prennent en charge la longueur du contexte natif spécifiée par le fournisseur de modèle. Toutefois, la longueur de contexte maximale en vigueur est également limitée par la configuration matérielle sous-jacente d'OCI Generative AI. Pour tirer pleinement parti de la longueur du contexte natif d'un modèle, vous devrez peut-être provisionner plus de ressources matérielles.
- Les modèles affinés ne sont pris en charge que s'ils correspondent à la version du transformateur du modèle de base pris en charge et ont un nombre de paramètres inférieur à ± 10 % de l'original.
- Pour le matériel disponible et les étapes de déploiement des modèles importés, voir Gestion des modèles importés.
- Si la forme d'unité recommandée n'est pas disponible dans la région, sélectionnez une option de niveau supérieur. Par exemple, si A100 n'est pas disponible, sélectionnez H100.