生成AIエージェントでのモデルの選択
OCI Generative AI Agentsサービスはモデル選択をサポートしており、作成または編集中にエージェントのルーティングLLMとして大規模言語モデル(LLM)を選択できます。OCI生成AIサービスでホストされているオンデマンド・モデルから選択することも、サポートされているモデル専用のAIクラスタ・エンドポイントを作成して使用することもできます。
モデル選択により、ワークロード(RAGやSQLツールなど)に基づいてエージェントのパフォーマンスを柔軟に最適化できます。
モデルの選択方法
OCIコンソールでエージェントを作成または編集する場合は、エージェントの構成の下の「モデルの選択」セクションに移動します。
-
ルーティングLLMタイプの選択:
- 次のオプションから選択します。
- デフォルト: 生成AIエージェント・サービス(Llama 3.3 70B)によって提供される標準モデルを使用します。これは、カスタムモデルを必要としない汎用エージェントに適しています。
- 生成AIモデル: OCI生成AIサービスで直接ホストされるオンデマンド・モデルから選択します。
- 生成AIエンドポイント: OCI生成AIサービスの専用AIクラスタ・エンドポイントでホストされているモデルから選択します。
- 次のオプションから選択します。
-
特定のモデルまたはエンドポイントの選択:
- リストから「生成AIモデル」または「生成AIエンドポイント」を選択した場合、コンソールに使用可能なオプションのリストが表示されます。適切なモデルまたはエンドポイントを参照して選択します。
- リストは、テナンシの使用可能なモデル/エンドポイントおよびIAM権限に基づいて移入されます
-
デフォルト・ハイパーパラメータの更新:
- モデル・ハイパーパラメータのデフォルト値を確認します。
- オプションで、これらのハイパーパラメータを更新します。
ヒント
- これらのモデルは、RAG、SQLおよびエージェント・ツールを追加するときに使用できます。
- これらのモデルの詳細を表示するには、このエージェントのエンドポイントを作成するときにトレースを有効にします。
- リストが移入されていない場合は、エージェントでのモデル選択へのユーザー・アクセス・ページの例から追加する必要があるポリシーを確認します。
サポートされるモデル
| 選択できるモデル | 更新できるハイパーパラメータ |
|---|---|
|
|
|
|
|
サポートされるリージョン
次のリージョンがサポートされています。
- ブラジル東部(サンパウロ)
- ドイツ中央部(フランクフルト)
- 日本中央部(大阪)
- 英国南部(ロンドン)
- 米国東部(アッシュバーン)
- 米国中西部(シカゴ)
- 米国西部(フェニックス)
エージェント・モデル選択機能のモデルの使用可能なリージョンを確認するには、次のタスクを実行します。
関連トピック
モデルがリージョンまたはモードで使用できない場合は、サポートされているリストの代替を検討してください。
関連トピック