多用性があるAlibabaモデル

大規模言語モデルをHugging FaceおよびOCI Object StorageバケットからOCI生成AIにインポートし、それらのモデルのエンドポイントを作成して生成AIサービスで使用できます。

Alibaba Qwenモデルファミリは、高度な多言語およびマルチモーダル機能を備えています。Hugging Faceのモデル・カードについては、次の表のリンクを参照してください。

Qwen 3.6

互換性のあるQwen 3.6モデル
Hugging FaceモデルID	モデル機能	推奨される専用AIクラスタ・ユニット・シェイプ
クウェン/クウェン3.6-35B-A3B	IMAGE_TEXT_TO_TEXT	H100_X2

Qwen 3.5

互換性のあるQwen 3.5モデル
Hugging FaceモデルID	モデル機能	推奨される専用AIクラスタ・ユニット・シェイプ
クウェン/クウェン3.5-9B	IMAGE_TEXT_TO_TEXT	H100_X1

Qwenイメージ

互換性のあるQwen Imageモデル
Hugging FaceモデルID	モデル機能	推奨される専用AIクラスタ・ユニット・シェイプ
Qwen/Qwen-Image	TEXT_TO_IMAGE	A100_80G_X1
Qwen/Qwen-Image-Edit	IMAGE_TEXT_TO_IMAGE	A100_80G_X1
クウェン/クウェンイメージ-2512	TEXT_TO_IMAGE	A100_80G_X1
Qwen/Qwen-Image-Edit-2511	IMAGE_TEXT_TO_IMAGE	A100_80G_X1
Qwen/Qwen-Image-Edit-2509	IMAGE_TEXT_TO_IMAGE	A100_80G_X1

ノート

response_format: "url"は機能せず、HTTP 400不正なリクエスト・エラーを返します。
n (イメージ数): 0または1のみが動作します。
ストリーミングは互換性がありません。
標準以外のイメージ・サイズは、(OpenAI APIとは異なり)HTTP 400を返すのではなく、丸められる場合があります(たとえば、999x999→ 992x992)。
モデル制限のため、透過性が機能しない場合があります。

クウェンQ(Reasoning)

互換性のあるQwen Qモデル
Hugging FaceモデルID	モデル機能	推奨される専用AIクラスタ・ユニット・シェイプ
クウェン/QwQ-32B	TEXT_TO_TEXT	A100_80G_X2

Qwen 3

互換性のあるQwen 3モデル
Hugging FaceモデルID	モデル機能	推奨される専用AIクラスタ・ユニット・シェイプ
クウェン/Qwen3- 埋め込み-0.6B	埋込み	A10_X1
クウェン/Qwen3- 埋め込み-4B	埋込み	A10_X2
クウェン/Qwen3- 埋め込み-8B	埋込み	A100_80G_X1
クウェン/Qwen3-0.6B	TEXT_TO_TEXT	A100_80G_X1
クウェン/Qwen3-1.7B	TEXT_TO_TEXT	A100_80G_X1
クウェン/Qwen3-4B	TEXT_TO_TEXT	A100_80G_X1
クウェン/Qwen3-8B	TEXT_TO_TEXT	A100_80G_X1
クウェン/Qwen3-14B	TEXT_TO_TEXT	A100_80G_X1
クウェン/Qwen3-32B	TEXT_TO_TEXT	A100_80G_X2
クウェン/Qwen3-4B-Instruct-2507	TEXT_TO_TEXT	A100_80G_X1
クウェン/Qwen3-30B-A3B-Instruct-2507	TEXT_TO_TEXT	A100_80G_X2
クウェン/Qwen3-235B-A22B-Instruct-2507	TEXT_TO_TEXT	H100_X8
Qwen/Qwen3-VL-30B-A3B-Instruct	IMAGE_TEXT_TO_TEXT	H100_X2
Qwen/Qwen3-VL-235B-A22B-Instruct	IMAGE_TEXT_TO_TEXT	H100_X8

クウェン2.5

互換性のあるQwen2.5モデル
Hugging FaceモデルID	モデル機能	推奨される専用AIクラスタ・ユニット・シェイプ
Qwen/Qwen2.5-Coder-32B-Instruct	TEXT_TO_TEXT	A100_80G_X2
Qwen/Qwen2.5-0.5B-Instruct	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-1.5B-Instruct	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-3B-Instruct	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-7B-Instruct	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-14B-Instruct	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-32B-Instruct	TEXT_TO_TEXT	A100_80G_X2
Qwen/Qwen2.5-72B-Instruct	TEXT_TO_TEXT	A100_80G_X4
Qwen/Qwen2.5-VL-3B-Instruct	IMAGE_TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-VL-7B-Instruct	IMAGE_TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2.5-VL-32B-Instruct	IMAGE_TEXT_TO_TEXT	A100_80G_X2
Qwen/Qwen2.5-VL-72B-Instruct	IMAGE_TEXT_TO_TEXT	A100_80G_X4

Qwen 2

互換性のあるQwen2モデル
Hugging FaceモデルID	モデル機能	推奨される専用AIクラスタ・ユニット・シェイプ
Qwen/Qwen2-0.5B-Instruct	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2-1.5B-Instruct	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2-7B-Instruct	TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2-72B-Instruct	TEXT_TO_TEXT	A100_80G_X4
Qwen/Qwen2-VL-2B-Instruct	IMAGE_TEXT_TO_TEXT	A100_80G_X1
Qwen/Qwen2-VL-7B-Instruct	イメージ・テキストからテキストへ	A100_80G_X1
Qwen/Qwen2-VL-72B-Instruct	イメージ・テキストからテキストへ	A100_80G_X4

重要

Open Model Engine(vLLMまたはSGLangランタイムを使用)を介して検証された任意のチャット、埋込み(およびファインチューニング)モデルをインポートできますが、このページの明示的にリストされたモデルのみは、オープンソース・モデル・ランタイムに対してOracleによってこのモデル・ファミリについて評価され、OracleでサポートされているGPU構成でテストされています。上記にかかわらず、Oracleは、互換性のあるモデルのパフォーマンス、可用性、操作またはセキュリティに関連する問題に対して責任を負いません。非リスト・モデルには互換性に問題がある可能性があり、本番で使用する前にリストされていないモデルをテストすることをお薦めします。OCI Generative AI Imported Model Architectureについて学習します。
インポートされたモデルの場合は、モデル・プロバイダによって指定されたネイティブ・コンテキスト長を使用できます。ただし、効果的な最大コンテキスト長は、OCI生成AIでホスティング専用AIクラスタに選択する基礎となるハードウェア設定によって制限されます。モデルのネイティブ・コンテキスト長を最大限に活用するには、より多くのハードウェア・リソースをプロビジョニングする必要がある場合があります。
ファインチューニング・モデルは、互換性のあるベース・モデルのトランスフォーマ・バージョンと一致し、パラメータ数が元のモデルの±10%以内である場合にのみ使用します。
インポートされたモデルのデプロイ方法に関する使用可能なハードウェアおよびステップは、インポートされたモデルの管理を参照してください。
推奨シェイプがリージョンで使用できない場合は、最も近い使用可能な代替を選択します。たとえば、H100_X2は使用できませんが、A100_80G_X2の場合は、A100_80G_X2を選択します。H100シェイプとA100シェイプの両方が使用可能な場合は、パフォーマンスを向上させるためにH100を選択します。

Oracle Cloud Infrastructureドキュメント

多用性があるAlibabaモデル

Qwen 3.6

Qwen 3.5

Qwenイメージ

クウェンQ(Reasoning)

Qwen 3

クウェン2.5

Qwen 2