インポートでサポートされているモデル
Hugging FaceおよびOCIオブジェクト・ストレージ・バケットからOCI生成AIに大規模言語モデルをインポートし、それらのモデルのエンドポイントを作成して生成AIサービスで使用できます。
サポートされているモデル・アーキテクチャ
生成AIサービスは、AIイニシアチブを高速化するために、主要なオープン・ソースおよびサードパーティ言語モデルのインポートとデプロイをサポートします。次のモデル・アーキテクチャがサポートされています。
チャットモデル
チャット・モデルを使用すると、質問をしたり、会話型のコンテキスト内回答をAIから取得できます。次のモデル・ファミリから選択して、ユース・ケースのスピード、品質およびコストのバランスをとります。サポートされているモデルのリストと、そのモデルID、モデル機能および推奨される専用AIクラスタ・ユニット・シェイプについては、各リンクを選択してください。
- Alibaba Qwen 3とQwen 2
高度な多言語およびマルチモーダル機能を備えています。
- Googleジェマ
幅広い言語処理ニーズと高い汎用性に対応。
- Llama2、Llama3、Llama3.1、Llama3.2、Llama3.3、Llama4
Grouped Query Attention(GQA)によるMeta Llamaモデルの改良版。
- Microsoft Phi
スケーラブルで柔軟なパフォーマンスのために設計された、効率性とコンパクトさで知られています。
- OpenAI GptOss
Mixture-of-Experts(MoE)アーキテクチャを備えた高度なオープンウェイト・トランスフォーマ・アーキテクチャで、効率的で高品質な言語推論と大規模なコンテキスト処理に最適化されています。
埋込みモデル
埋込みモデルは、入力データ(単語やイメージなど)を、セマンティックな意味または関係を取得する数値ベクトルに変換します。これにより、マシンはデータ内の類似性、関係およびパターンをより効果的に理解できます。モデルID、モデル機能および推奨される専用AIクラスタ・ユニット・シェイプについて、次のリンクを選択します。
- ミストラル
Sliding Window Attention(SWA)を搭載した高性能デコーダ専用トランスフォーマ・アーキテクチャにより、効率的な長時間のコンテキスト処理とオプションのGrouped Query Attention(GQA)により、スケーラビリティが向上します。