Unterstützte Alibaba-Modelle
Sie können große Sprachmodelle aus Hugging Face- und OCI Object Storage-Buckets in OCI Generative AI importieren, Endpunkte für diese Modelle erstellen und im generativen KI-Service verwenden.
Alibaba Qwen Modellfamilie, verfügen über erweiterte mehrsprachige und multimodale Funktionen. Weitere Informationen finden Sie in der Hugging Face-Dokumentation unter Qwen2, Qwen2 VL, Qwen2.5 VL, Qwen3, Qwen3 VL.
Qwen 3
| Umarmende Gesichtsmodell-ID | Modellfähigkeit | Empfohlene Ausprägung der dedizierten KI-Clustereinheit |
|---|---|---|
| Qwen/Qwen3-0.6B | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen3-1.7B | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen3-4B | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen3-8B | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen3-14B | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen3-32B | TEXT_TO_TEXT | A100_80G_X2 |
| Qwen/Qwen3-4B-Instanz-2507 | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen3-30B-A3B-Instanz-2507 | TEXT_TO_TEXT | A100_80G_X2 |
| Qwen/Qwen3-235B-A22B-Instanz-2507 | TEXT_TO_TEXT | H100_X8 |
| Qwen/Qwen3-VL-30B-A3B-Instanz | IMAGE_TEXT_TO_TEXT | H100_X2 |
| Qwen/Qwen3-VL-235B-A22B-Instanz | IMAGE_TEXT_TO_TEXT | H100_X8 |
Qwen 2
| Umarmende Gesichtsmodell-ID | Modellfähigkeit | Empfohlene Ausprägung der dedizierten KI-Clustereinheit |
|---|---|---|
| Qwen/Qwen2-0.5B-Instanz | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2-1.5B-Instanz | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2-7B-Instanz | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2-72B-Instanz | TEXT_TO_TEXT | A100_80G_X4 |
| Qwen/Qwen2-VL-2B-Instanz | IMAGE_TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2-VL-7B-Instanz | IMAGE_TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2-VL-72B-Instanz | IMAGE_TEXT_TO_TEXT | A100_80G_X4 |
| Qwen/Qwen2.5-0.5B-Instanz | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2.5-1.5B-Instanz | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2.5-3B-Instanz | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2.5-7B-Instanz | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2.5-14B-Instanz | TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2.5-32B-Instanz | TEXT_TO_TEXT | A100_80G_X2 |
| Qwen/Qwen2.5-72B-Instanz | TEXT_TO_TEXT | A100_80G_X4 |
| Qwen/Qwen2.5-VL-3B-Instanz | IMAGE_TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2.5-VL-7B-Instanz | IMAGE_TEXT_TO_TEXT | A100_80G_X1 |
| Qwen/Qwen2.5-VL-32B-Instanz | IMAGE_TEXT_TO_TEXT | A100_80G_X2 |
| Qwen/Qwen2.5-VL-72B-Instanz | IMAGE_TEXT_TO_TEXT | A100_80G_X4 |
Hinweis
- Um eine fein abgestimmte Version eines Modells zu importieren, werden nur fein abgestimmte Modelle unterstützt, die dieselbe Transformatorversion wie das Originalmodell verwenden und eine Parameteranzahl innerhalb von ±10% des Originals haben.
- Wenn der Instanztyp für die empfohlene Einheitenausprägung in Ihrer Region nicht verfügbar ist, wählen Sie eine Instanz der höheren Ebene aus (Beispiel: Wählen Sie eine Ausprägung H100 anstelle einer Ausprägung A100-80G aus).
- Voraussetzungen und das Importieren von Modellen finden Sie unter Importierte Modelle verwalten (Neu).