エンタープライズAIエージェントの生成AIモデルとリージョン

OCI Generative AIのエンタープライズAIエージェントは、OCI Generative AIの事前トレーニング済みモデルとリージョンのサブセットをサポートしています。このページには、ランタイム・エージェント推論およびプロジェクト・メモリーでサポートされるモデルとリージョンがリストされます。

モデルを呼び出すには

ノート

OCI OpenAI互換エンドポイントおよびOpenAI互換ツールでは、次のモデルがサポートされています。

使用可能なチャット・モデル

エージェントは、エージェント推論ユース・ケースに対して次のチャット・モデルをコールできます。

Google Vertex AIプラットフォーム

OpenAIオープン・ソース

xAIプラットフォーム

重要

xAI Grokモデルへの外部コール

xAI Grokモデルは、xAI用にプロビジョニングされたテナンシ内のOCIデータ・センターでホストされます。OCI Generative AIサービスを介してアクセスできるxAI Grokモデルは、xAIによって管理されます。

利用可能な商業地域(OC1)

次の1つ以上のOC1リージョンでエージェント推論モデルにアクセスできます。


地域名	場所	リージョン識別子	リージョン・キー
ブラジル東部(サンパウロ)	サンパウロ	`sa-saopaulo-1`	`GRU`
ドイツ中央部(フランクフルト)	フランクフルト	`eu-frankfurt-1`	`FRA`
インド南部(ハイデラバード)	ハイデラバード	`ap-hyderabad-1`	`HYD`
日本中央部(大阪)	大阪	`ap-osaka-1`	`KIX`
サウジアラビア中央部(リヤド)	リヤド	`me-riyadh-1`	`RUH`
英国南部(ロンドン)	ロンドン	`uk-london-1`	`LHR`
米国東部(アッシュバーン)	アッシュバーン	`us-ashburn-1`	`IAD`
米国中西部(シカゴ)	シカゴ	`us-chicago-1`	`ORD`
米国西部(フェニックス)	フェニックス	`us-phoenix-1`	`PHX`

リージョンおよび可用性ドメインについてについて学習します。

ノート

UAE East (Dubai): OCI-OpenAI互換エンドポイントおよびツールは、このリージョンでは使用できません。
可用性:リストされているすべてのモデルが前述のリージョンで使用できるわけではありません。モデルごとにサポートされているリージョンおよびデプロイメントの詳細は、リージョン別のモデル・ページを参照してください。
外部コール:外部コールを使用するモデルに関するノートは、外部コールを参照してください。

ノート

OCI Responses APIで使用されるxAI互換ツールでは、次のモデルがサポートされています。

サポートされているxAIモデル

ノート

OCIレスポンスAPIでは、次のxAIモデルがサポートされています。

サポートされるリージョン

xAIモデルにアクセスするには、次のOC1リージョンのエンドポイントをコールします:


地域名	場所	リージョン識別子	リージョン・キー
米国東部(アッシュバーン)	アッシュバーン	`us-ashburn-1`	`IAD`
米国中西部(シカゴ)	シカゴ	`us-chicago-1`	`ORD`
米国西部(フェニックス)	フェニックス	`us-phoenix-1`	`PHX`

重要

xAI Grokモデルへの外部コール

プロジェクトメモリーを有効にする

プロジェクトを作成するときに、そのプロジェクトに関連する会話および応答に対して短期的なメモリー圧縮を有効にできます。メモリー圧縮に使用可能なモデルおよび領域については、次の表を参照してください。


リージョン	リージョン・コード	短期メモリー・モデル
ブラジル東部(サンパウロ)	`sa-saopaulo-1`	Meta Llama 3.3(70B) OpenAI gpt-oss-120b
ドイツ中央部(フランクフルト)	`eu-frankfurt-1`	Google Gemini 2.5 Pro Google Gemini 2.5 Flash Google Gemini 2.5 Flash-Lite Meta Llama 3.3(70B) OpenAI gpt-oss-120b
英国南部(ロンドン)	`uk-london-1`	Google Gemini 2.5 Flash Meta Llama 3.3(70B) OpenAI gpt-oss-120b
インド南部(ハイデラバード)	`ap-hyderabad-1`	Google Gemini 2.5 Flash Meta Llama 3.3(70B) OpenAI gpt-oss-120b
米国東部(アッシュバーン)(米国中西部(シカゴ)へのクロス・リージョン)	`us-ahsburn-1` (`us-chicago-1`へのクロス・リージョン)	Google Gemini 2.5 Pro Google Gemini 2.5 Flash Google Gemini 2.5 Flash-Lite Meta Llama 4 Maverick Meta Llama 4 Scout Meta Llama 3.3(70B) OpenAI gpt-oss-120b
日本中央部(大阪)	`ap-osaka-1`	Google Gemini 2.5 Pro Google Gemini 2.5 Flash Meta Llama 3.3(70B) OpenAI gpt-oss-120b
サウジアラビア中央部(リヤド)	`me-riyadh-1`	Meta Llama 3.3(70B) OpenAI gpt-oss-120b
米国中西部(シカゴ)	`us-chicago-1`	Google Gemini 2.5 Pro Google Gemini 2.5 Flash Google Gemini 2.5 Flash-Lite Meta Llama 4 Maverick Meta Llama 4 Scout Meta Llama 3.3(70B) OpenAI gpt-oss-120b
米国西部(フェニックス) (米国中西部(シカゴ)へのクロス・リージョン)	`us-phoenix-1`(リージョン間を `us-chicago-1`に)	Google Gemini 2.5 Pro Google Gemini 2.5 Flash Google Gemini 2.5 Flash-Lite Meta Llama 4 Maverick Meta Llama 4 Scout Meta Llama 3.3(70B) OpenAI gpt-oss-120b

長期メモリーの主要情報の抽出用

ハット

プロジェクトを作成するときに、長期的なメモリー機能について会話およびレスポンスからの情報抽出を有効にできます。会話からキー情報を抽出する抽出モデルを選択します。長期的なメモリーに使用するキー情報の抽出でサポートされているリージョンおよびモデルについては、次の表を参照してください。


リージョン	使用可能な抽出モデル
使用可能な商用リージョン(OC1)と、OpenAI gpt-oss-120bが使用可能なリージョンとの相互参照	OpenAI gpt-oss-120b

プロジェクトを作成するときに、抽出されたメモリーを検索可能なベクトルとして格納する埋込みモデルを選択できます。使用可能な埋込みモデルは、プロジェクト・リージョンによって異なります。各リージョンで使用可能な埋込みモデルについては、次の表を参照してください。


リージョン	リージョン・コード	使用可能な埋込みモデル
ブラジル東部(サンパウロ)	`sa-saopaulo-1`	Cohere Embed Multilingual 3 (非推奨)
ドイツ中央部(フランクフルト)	`eu-frankfurt-1`	Cohere Embed Multilingual 3 (非推奨)
英国南部(ロンドン)	`uk-london-1`	Cohere Embed Multilingual 3 (非推奨)
インド南部(ハイデラバード)	`ap-hyderabad-1`	Cohere Embed Multilingual Image 3 (非推奨)
米国東部(アッシュバーン)(米国中西部(シカゴ)へのクロス・リージョン)	`us-ahsburn-1`	Cohere Embed 4
日本中央部(大阪)	`ap-osaka-1`	Cohere Embed 4
サウジアラビア中央部(リヤド)	`me-riyadh-1`	Cohere Embed 4
米国中西部(シカゴ)	`us-chicago-1`	Cohere Embed 4
米国西部(フェニックス) (米国中西部(シカゴ)へのクロス・リージョン)	`us-phoenix-1`	Cohere Embed 4

外部コール

xAI Grokモデルへの外部コール

重要

xAI Grokモデルへの外部コール

Googleモデルへの外部コール

重要

米国リージョンのGoogle Gemini 2.5 Proへの外部コール

米国リージョンのOCI生成AIサービスを介してアクセスできるGoogle Gemini 2.5 Proモデルは、外部でGoogleによってホストされます。したがって、(OCI生成AIサービスを介して)Google Gemini 2.5 Proモデルをコールすると、Googleロケーションがコールされます。Google Gemini 2.5 Proでは、Google Americaasのリージョナル・ロケーションが使用され、リクエストはGoogle Americaasのロケーションにのみルーティングされます。機械学習処理は、Google Americasのロケーション内で行われます。

重要

米国リージョンのGemini 2.5 Flashへの外部コール

米国リージョンのOCI生成AIサービスを介してアクセスできるGemini 2.5 Flashモデルは、外部でGoogleによってホストされます。したがって、(OCI生成AIサービスを介して)Gemini 2.5 Flashモデルをコールすると、Googleロケーションがコールされます。Gemini 2.5 Flashでは、Google Americaasのリージョナル・ロケーションが使用され、リクエストはGoogle Americaasのロケーションにのみルーティングされます。機械学習処理は、Google Americasのロケーション内で行われます。

重要

米国リージョンのGemini 2.5 Flash-Liteへの外部コール

米国リージョンのOCI生成AIサービスを介してアクセスできるGemini 2.5 Flash-Liteモデルは、外部でGoogleによってホストされます。したがって、(OCI生成AIサービスを介して)Gemini 2.5 Flash-Liteモデルをコールすると、Googleロケーションがコールされます。Gemini 2.5 Flash-Liteでは、Google Americaasのリージョナル・ロケーションが使用され、リクエストはGoogle Americaasのロケーションにのみルーティングされます。機械学習処理は、Google Americasのロケーション内で行われます。

Oracle Cloud Infrastructureドキュメント

エンタープライズAIエージェントの生成AIモデルとリージョン

モデルを呼び出すには

使用可能なチャット・モデル

利用可能な商業地域(OC1)

サポートされているxAIモデル

サポートされるリージョン

プロジェクトメモリーを有効にする

長期メモリーの主要情報の抽出用

外部コール

xAI Grokモデルへの外部コール

Googleモデルへの外部コール