Unterstützte Alibaba-Modelle

Sie können große Sprachmodelle aus Hugging Face- und OCI Object Storage-Buckets in OCI Generative AI importieren, Endpunkte für diese Modelle erstellen und im generativen KI-Service verwenden.

Alibaba Qwen Modellfamilie, verfügen über erweiterte mehrsprachige und multimodale Funktionen. Weitere Informationen finden Sie in der Hugging Face-Dokumentation unter Qwen2, Qwen2 VL, Qwen2.5 VL, Qwen3, Qwen3 VL.

Qwen 3

Unterstützte Qwen3-Modelle
Umarmende Gesichtsmodell-ID Modellfähigkeit Empfohlene Ausprägung der dedizierten KI-Clustereinheit
Qwen/Qwen3-0.6B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-1.7B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-4B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-8B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-14B TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-32B TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen3-4B-Instanz-2507 TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen3-30B-A3B-Instanz-2507 TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen3-235B-A22B-Instanz-2507 TEXT_TO_TEXT H100_X8
Qwen/Qwen3-VL-30B-A3B-Instanz IMAGE_TEXT_TO_TEXT H100_X2
Qwen/Qwen3-VL-235B-A22B-Instanz IMAGE_TEXT_TO_TEXT H100_X8

Qwen 2

Unterstützte Qwen2-Modelle
Umarmende Gesichtsmodell-ID Modellfähigkeit Empfohlene Ausprägung der dedizierten KI-Clustereinheit
Qwen/Qwen2-0.5B-Instanz TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-1.5B-Instanz TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-7B-Instanz TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-72B-Instanz TEXT_TO_TEXT A100_80G_X4
Qwen/Qwen2-VL-2B-Instanz IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-VL-7B-Instanz IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-VL-72B-Instanz IMAGE_TEXT_TO_TEXT A100_80G_X4
Qwen/Qwen2.5-0.5B-Instanz TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-1.5B-Instanz TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-3B-Instanz TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-7B-Instanz TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-14B-Instanz TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-32B-Instanz TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen2.5-72B-Instanz TEXT_TO_TEXT A100_80G_X4
Qwen/Qwen2.5-VL-3B-Instanz IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-VL-7B-Instanz IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-VL-32B-Instanz IMAGE_TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen2.5-VL-72B-Instanz IMAGE_TEXT_TO_TEXT A100_80G_X4
Hinweis

  • Um eine fein abgestimmte Version eines Modells zu importieren, werden nur fein abgestimmte Modelle unterstützt, die dieselbe Transformatorversion wie das Originalmodell verwenden und eine Parameteranzahl innerhalb von ±10% des Originals haben.
  • Wenn der Instanztyp für die empfohlene Einheitenausprägung in Ihrer Region nicht verfügbar ist, wählen Sie eine Instanz der höheren Ebene aus (Beispiel: Wählen Sie eine Ausprägung H100 anstelle einer Ausprägung A100-80G aus).
  • Voraussetzungen und das Importieren von Modellen finden Sie unter Importierte Modelle verwalten (Neu).