互換性のあるGoogleモデル

大規模言語モデルをHugging FaceおよびOCI Object StorageバケットからOCI生成AIにインポートし、それらのモデルのエンドポイントを作成して生成AIサービスで使用できます。

これらのモデルの詳細は、Hugging Faceのドキュメントを参照してください:

Gemma

互換性のあるGemmaモデル
Hugging FaceモデルID	モデル機能	推奨される専用AIクラスタ・ユニット・シェイプ
google/gemma-4-31B-it	IMAGE_TEXT_TO_TEXT	H100_X2
google/gemma-3-4b-it	IMAGE_TEXT_TO_TEXT	A100_80G_X1
google/gemma-3-270m-it	TEXT_TO_TEXT	A100_80G_X1
google/gemma-3-27b-it	IMAGE_TEXT_TO_TEXT	A100_80G_X2
google/gemma-3-12b-it	イメージ・テキストからテキストへ	A100_80G_X1
google/gemma-3-1b-it	TEXT_TO_TEXT	A100_80G_X1
google/gemma-2-9b-it	TEXT_TO_TEXT	A100_80G_X1
google/gemma-2-27b-it	TEXT_TO_TEXT	A100_80G_X2
google/gemma-2-2b-it	TEXT_TO_TEXT	A100_80G_X1

重要

Open Model Engine(vLLMまたはSGLangランタイムを使用)を介して検証された任意のチャット、埋込み(およびファインチューニング)モデルをインポートできますが、このページの明示的にリストされたモデルのみは、オープンソース・モデル・ランタイムに対してOracleによってこのモデル・ファミリについて評価され、OracleでサポートされているGPU構成でテストされています。上記にかかわらず、Oracleは、互換性のあるモデルのパフォーマンス、可用性、操作またはセキュリティに関連する問題に対して責任を負いません。非リスト・モデルには互換性に問題がある可能性があり、本番で使用する前にリストされていないモデルをテストすることをお薦めします。OCI Generative AI Imported Model Architectureについて学習します。
インポートされたモデルの場合は、モデル・プロバイダによって指定されたネイティブ・コンテキスト長を使用できます。ただし、効果的な最大コンテキスト長は、OCI生成AIでホスティング専用AIクラスタに選択する基礎となるハードウェア設定によって制限されます。モデルのネイティブ・コンテキスト長を最大限に活用するには、より多くのハードウェア・リソースをプロビジョニングする必要がある場合があります。
ファインチューニング・モデルは、互換性のあるベース・モデルのトランスフォーマ・バージョンと一致し、パラメータ数が元のモデルの±10%以内である場合にのみ使用します。
インポートされたモデルのデプロイ方法に関する使用可能なハードウェアおよびステップは、インポートされたモデルの管理を参照してください。
推奨シェイプがリージョンで使用できない場合は、最も近い使用可能な代替を選択します。たとえば、H100_X2は使用できませんが、A100_80G_X2の場合は、A100_80G_X2を選択します。H100シェイプとA100シェイプの両方が使用可能な場合は、パフォーマンスを向上させるためにH100を選択します。

Oracle Cloud Infrastructureドキュメント

互換性のあるGoogleモデル

Gemma