サポートされているAlibabaモデル

大規模言語モデルをHugging FaceおよびOCI Object StorageバケットからOCI生成AIにインポートし、それらのモデルのエンドポイントを作成して生成AIサービスで使用できます。

Alibaba Qwenモデルファミリは、高度な多言語およびマルチモーダル機能を備えています。Hugging Faceのモデル・カードについては、次の表のリンクを参照してください。

Qwen 3

サポートされているQwen 3モデル
Hugging FaceモデルID モデル機能 推奨される専用AIクラスタ・ユニット・シェイプ
クウェン/Qwen3-0.6B TEXT_TO_TEXT A100_80G_X1
クウェン/Qwen3-1.7B TEXT_TO_TEXT A100_80G_X1
クウェン/Qwen3-4B TEXT_TO_TEXT A100_80G_X1
クウェン/Qwen3-8B TEXT_TO_TEXT A100_80G_X1
クウェン/Qwen3-14B TEXT_TO_TEXT A100_80G_X1
クウェン/Qwen3-32B TEXT_TO_TEXT A100_80G_X2
クウェン/Qwen3-4B-Instruct-2507 TEXT_TO_TEXT A100_80G_X1
クウェン/Qwen3-30B-A3B-Instruct-2507 TEXT_TO_TEXT A100_80G_X2
クウェン/Qwen3-235B-A22B-Instruct-2507 TEXT_TO_TEXT H100_X8
Qwen/Qwen3-VL-30B-A3B-Instruct IMAGE_TEXT_TO_TEXT H100_X2
Qwen/Qwen3-VL-235B-A22B-Instruct IMAGE_TEXT_TO_TEXT H100_X8

クウェン2.5

サポートされているQwen2.5モデル
Hugging FaceモデルID モデル機能 推奨される専用AIクラスタ・ユニット・シェイプ
Qwen/Qwen2.5-0.5B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-1.5B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-3B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-7B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-14B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-32B-Instruct TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen2.5-72B-Instruct TEXT_TO_TEXT A100_80G_X4
Qwen/Qwen2.5-VL-3B-Instruct IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-VL-7B-Instruct IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2.5-VL-32B-Instruct IMAGE_TEXT_TO_TEXT A100_80G_X2
Qwen/Qwen2.5-VL-72B-Instruct IMAGE_TEXT_TO_TEXT A100_80G_X4

Qwen 2

サポートされているQwen2モデル
Hugging FaceモデルID モデル機能 推奨される専用AIクラスタ・ユニット・シェイプ
Qwen/Qwen2-0.5B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-1.5B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-7B-Instruct TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-72B-Instruct TEXT_TO_TEXT A100_80G_X4
Qwen/Qwen2-VL-2B-Instruct IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-VL-7B-Instruct IMAGE_TEXT_TO_TEXT A100_80G_X1
Qwen/Qwen2-VL-72B-Instruct IMAGE_TEXT_TO_TEXT A100_80G_X4
重要

  • オープン・モデル・エンジン(vLLMまたはSGLangランタイムを使用)でサポートされている任意のチャット、埋込み(およびファインチューニング)モデルをインポートできますが、このモデル・ファミリでは、このページに明示的にリストされたモデルのみがサポートされます。非リスト・モデルには互換性に問題がある可能性があり、本番で使用する前にリストされていないモデルをテストすることをお薦めします。OCI Generative AI Imported Model Architectureについて学習します。

  • インポートされたモデルは、モデル・プロバイダによって指定されたネイティブ・コンテキスト長をサポートします。ただし、効果的な最大コンテキスト長は、OCI生成AIの基礎となるハードウェア設定によっても制限されます。モデルのネイティブ・コンテキスト長を最大限に活用するには、より多くのハードウェア・リソースをプロビジョニングする必要がある場合があります。
  • ファインチューニング・モデルは、サポートされているベース・モデルのトランスフォーマ・バージョンと一致し、パラメータ数が元のモデルの±10%以内である場合にのみサポートされます。
  • インポートされたモデルのデプロイ方法に関する使用可能なハードウェアおよびステップは、インポートされたモデルの管理を参照してください。
  • 推奨単位形状がリージョンで使用できない場合は、上位層オプションを選択します。たとえば、A100を使用できない場合は、H100を選択します。