エンタープライズAIエージェントの生成AIモデルとリージョン

OCI Generative AIのエンタープライズAIエージェントは、OCI Generative AIの事前トレーニング済みモデルとリージョンのサブセットをサポートしています。このページには、ランタイム・エージェント推論およびプロジェクト・メモリーでサポートされるモデルとリージョンがリストされます。

モデルを呼び出すには

OCI-OpenAI互換エンドポイントおよびツールの場合
ノート

OCI OpenAI互換エンドポイントおよびOpenAI互換ツールでは、次のモデルがサポートされています。

使用可能なチャット・モデル

エージェントは、エージェント推論ユース・ケースに対して次のチャット・モデルをコールできます。

Google Vertex AIプラットフォーム
OpenAIオープン・ソース
xAIプラットフォーム
重要

xAI Grokモデルへの外部コール

xAI Grokモデルは、xAI用にプロビジョニングされたテナンシ内のOCIデータ・センターでホストされます。OCI Generative AIサービスを介してアクセスできるxAI Grokモデルは、xAIによって管理されます。

利用可能な商業地域(OC1)

次の1つ以上のOC1リージョンでエージェント推論モデルにアクセスできます。

地域名 場所 リージョン識別子 リージョン・キー
ブラジル東部(サンパウロ) サンパウロ sa-saopaulo-1 GRU
ドイツ中央部(フランクフルト) フランクフルト eu-frankfurt-1 FRA
インド南部(ハイデラバード) ハイデラバード ap-hyderabad-1 HYD
日本中央部(大阪) 大阪 ap-osaka-1 KIX
サウジアラビア中央部(リヤド) リヤド me-riyadh-1 RUH
英国南部(ロンドン) ロンドン uk-london-1 LHR
米国東部(アッシュバーン) アッシュバーン us-ashburn-1 IAD
米国中西部(シカゴ) シカゴ us-chicago-1 ORD
米国西部(フェニックス) フェニックス us-phoenix-1 PHX

リージョンおよび可用性ドメインについてについて学習します。

ノート

  • UAE East (Dubai): OCI-OpenAI互換エンドポイントおよびツールは、このリージョンでは使用できません。
  • 可用性:リストされているすべてのモデルが前述のリージョンで使用できるわけではありません。モデルごとにサポートされているリージョンおよびデプロイメントの詳細は、リージョン別のモデル・ページを参照してください。
  • 外部コール:外部コールを使用するモデルに関するノートは、外部コールを参照してください。

プロジェクトメモリーを有効にする

短期メモリー(会話履歴)圧縮用

プロジェクトを作成するときに、そのプロジェクトに関連する会話および応答に対して短期的なメモリー圧縮を有効にできます。メモリー圧縮に使用可能なモデルおよび領域については、次の表を参照してください。

リージョン リージョン・コード 短期メモリー・モデル
ブラジル東部(サンパウロ) sa-saopaulo-1
ドイツ中央部(フランクフルト) eu-frankfurt-1
英国南部(ロンドン) uk-london-1
インド南部(ハイデラバード) ap-hyderabad-1
米国東部(アッシュバーン)(米国中西部(シカゴ)へのクロス・リージョン) us-ahsburn-1 (us-chicago-1へのクロス・リージョン)
日本中央部(大阪) ap-osaka-1
サウジアラビア中央部(リヤド) me-riyadh-1
米国中西部(シカゴ) us-chicago-1
米国西部(フェニックス) (米国中西部(シカゴ)へのクロス・リージョン) us-phoenix-1(リージョン間を us-chicago-1に)

長期メモリーの主要情報の抽出用

ハット

プロジェクトを作成するときに、長期的なメモリー機能について会話およびレスポンスからの情報抽出を有効にできます。会話からキー情報を抽出する抽出モデルを選択します。長期的なメモリーに使用するキー情報の抽出でサポートされているリージョンおよびモデルについては、次の表を参照してください。

リージョン 使用可能な抽出モデル
使用可能な商用リージョン(OC1)と、OpenAI gpt-oss-120bが使用可能なリージョンとの相互参照 OpenAI gpt-oss-120b
長期メモリーの埋込みとして主要情報を格納する場合

プロジェクトを作成するときに、抽出されたメモリーを検索可能なベクトルとして格納する埋込みモデルを選択できます。使用可能な埋込みモデルは、プロジェクト・リージョンによって異なります。各リージョンで使用可能な埋込みモデルについては、次の表を参照してください。

リージョン リージョン・コード 使用可能な埋込みモデル
ブラジル東部(サンパウロ) sa-saopaulo-1 Cohere Embed Multilingual 3 (非推奨)
ドイツ中央部(フランクフルト) eu-frankfurt-1 Cohere Embed Multilingual 3 (非推奨)
英国南部(ロンドン) uk-london-1 Cohere Embed Multilingual 3 (非推奨)
インド南部(ハイデラバード) ap-hyderabad-1 Cohere Embed Multilingual Image 3 (非推奨)
米国東部(アッシュバーン)(米国中西部(シカゴ)へのクロス・リージョン) us-ahsburn-1 Cohere Embed 4
日本中央部(大阪) ap-osaka-1 Cohere Embed 4
サウジアラビア中央部(リヤド) me-riyadh-1 Cohere Embed 4
米国中西部(シカゴ) us-chicago-1 Cohere Embed 4
米国西部(フェニックス) (米国中西部(シカゴ)へのクロス・リージョン) us-phoenix-1 Cohere Embed 4

外部コール

xAI Grokモデルへの外部コール

重要

xAI Grokモデルへの外部コール

xAI Grokモデルは、xAI用にプロビジョニングされたテナンシ内のOCIデータ・センターでホストされます。OCI Generative AIサービスを介してアクセスできるxAI Grokモデルは、xAIによって管理されます。

Googleモデルへの外部コール

重要

米国リージョンのGoogle Gemini 2.5 Proへの外部コール

米国リージョンのOCI生成AIサービスを介してアクセスできるGoogle Gemini 2.5 Proモデルは、外部でGoogleによってホストされます。したがって、(OCI生成AIサービスを介して)Google Gemini 2.5 Proモデルをコールすると、Googleロケーションがコールされます。Google Gemini 2.5 Proでは、Google Americaasのリージョナル・ロケーションが使用され、リクエストはGoogle Americaasのロケーションにのみルーティングされます。機械学習処理は、Google Americasのロケーション内で行われます。

重要

米国リージョンのGemini 2.5 Flashへの外部コール

米国リージョンのOCI生成AIサービスを介してアクセスできるGemini 2.5 Flashモデルは、外部でGoogleによってホストされます。したがって、(OCI生成AIサービスを介して)Gemini 2.5 Flashモデルをコールすると、Googleロケーションがコールされます。Gemini 2.5 Flashでは、Google Americaasのリージョナル・ロケーションが使用され、リクエストはGoogle Americaasのロケーションにのみルーティングされます。機械学習処理は、Google Americasのロケーション内で行われます。

重要

米国リージョンのGemini 2.5 Flash-Liteへの外部コール

米国リージョンのOCI生成AIサービスを介してアクセスできるGemini 2.5 Flash-Liteモデルは、外部でGoogleによってホストされます。したがって、(OCI生成AIサービスを介して)Gemini 2.5 Flash-Liteモデルをコールすると、Googleロケーションがコールされます。Gemini 2.5 Flash-Liteでは、Google Americaasのリージョナル・ロケーションが使用され、リクエストはGoogle Americaasのロケーションにのみルーティングされます。機械学習処理は、Google Americasのロケーション内で行われます。