Generative KI-Modelle und -Regionen für die Agent-API

Auf dieser Seite wird die Teilmenge der vortrainierten Modelle und Regionen aufgeführt, die für agentische Features in OCI Generative AI unterstützt werden.

Agentische Features umfassen:

  • Agentische Inferenz (Laufzeitchataufrufe), die von Agents zur Laufzeit verwendet wird.
  • Projektspeichermodelle, die verwendet werden, wenn Sie einem OCI Generative AI-Projekt eine Langzeitspeicherextraktion und eine Kurzzeitspeicherextraktion hinzufügen.

1. Agentische Inferenzmodelle (Laufzeit)

Verfügbare Regionen

Sie können in mindestens einer der folgenden OC1-Regionen auf Agentic-Inferenzmodelle zugreifen:

Nordamerika
  • US East (Ashburn)
  • US Midwest (Chicago)
  • US West (Phoenix)
Südamerika
  • Brazil East (Sao Paulo)
Europa (EU)
  • Germany Central (Frankfurt)
  • UK South (London)
Naher Osten (ME)
  • Saudi Arabia Central (Riad)
  • Hinweis

    Die Agent-API ist in den VAE East (Dubai) nicht verfügbar.
Asien-Pazifik (AP)
  • India South (Hyderabad)
  • Japan Central (Osaka)
Wichtig

Nicht jedes Modell ist in jeder Region in der oben aufgeführten Liste verfügbar. Unterstützte Regionen und Deployment-Details für jedes Modell finden Sie auf der Seite Modelle nach Region.

Projektspeichermodelle (Projekteinstellungen)

Wenn Sie ein Projekt erstellen und Speicherfunktionen aktivieren, wählen Sie Modelle für:

  • Komprimierung des Kurzzeitgedächtnisses (Komprimierung der Gesprächshistorie)
  • Langzeitgedächtnisextraktion (zielt darauf ab, wichtige Informationen aus Unterhaltungen zu extrahieren)
  • Langfristige Speichereinbettungen (speichert extrahierte Speicher als durchsuchbare Vektoren)

2.1 Kurzzeitgedächtnisverdichtung (Konversationsverlaufsverdichtung)

Projekte können die folgenden Modelle für die Kurzzeitgedächtnisverdichtung verwenden:

Region Regions-Code Modell einbetten
Brazil East (Sao Paulo) sa-saopaulo-1
Meta
OpenAI Open Source
Germany Central (Frankfurt) eu-frankfurt-1
Google Vertex AI-Plattform
Meta
OpenAI Open Source
UK South (London) uk-london-1
Google Vertex AI-Plattform
Meta
OpenAI Open Source
India South (Hyderabad) ap-hyderabad-1
Google Vertex AI-Plattform
Meta
OpenAI Open Source
US East (Ashburn) (regional zu US Midwest (Chicago) us-ahsburn-1 (regionsübergreifend zu us-chicago-1)
Google Vertex AI-Plattform
Meta
OpenAI Open Source
Japan Central (Osaka) ap-osaka-1
Google Vertex AI-Plattform
Meta
OpenAI Open Source
Saudi Arabia Central (Riad) me-riyadh-1
Meta
OpenAI Open Source
US Midwest (Chicago) us-chicago-1
Google Vertex AI-Plattform
Meta
OpenAI Open Source
US West (Phoenix) (regional zu US Midwest (Chicago) us-phoenix-1(regionsübergreifend nach us-chicago-1)
Google Vertex AI-Plattform
Meta
OpenAI Open Source

2.2 Langfristiges Gedächtnis

Extraktionsmodell (alle unterstützten Regionen)
OpenAI gpt-oss-120b
Einbettungsmodell

Das Einbettungsmodell, mit dem extrahierte Speicher als durchsuchbare Vektoren gespeichert werden, hängt vom Projektbereich ab:

Region Regions-Code Modell einbetten
Brazil East (Sao Paulo) sa-saopaulo-1 Cohere Einbettung Mehrsprachig 3
Germany Central (Frankfurt) eu-frankfurt-1 Cohere Einbettung Mehrsprachig 3
UK South (London) uk-london-1 Cohere Einbettung Mehrsprachig 3
India South (Hyderabad) ap-hyderabad-1 Cohere Einbettung Mehrsprachiges Bild 3
US East (Ashburn) (regional zu US Midwest (Chicago)

Siehe Externe Anrufe

us-ahsburn-1 (regionsübergreifend zu us-chicago-1) Cohere Einbettung 4
Japan Central (Osaka) ap-osaka-1 Cohere Einbettung 4
Saudi Arabia Central (Riad) me-riyadh-1 Cohere Einbettung 4
US Midwest (Chicago) us-chicago-1 Cohere Einbettung 4
US West (Phoenix) (regional zu US Midwest (Chicago)

Siehe Externe Anrufe

us-phoenix-1 (regionsübergreifend zu us-chicago-1) Cohere Einbettung 4

Hinweise und bekannte Einschränkungen

  • VAE Ost (Dubai): Die Agent-API ist in dieser Region nicht verfügbar.
  • Verfügbarkeit: Regionen, die für Agentic-Inferenzmodelle auf dieser Seite aufgeführt sind, geben an, wo Agentic-Features unterstützt werden. Die Verfügbarkeit einzelner Modelle kann innerhalb dieser Regionen noch variieren.

Externe Anrufe zu Google-Modellen

Wichtig

Externe Aufrufe an Google Gemini 2.5 Pro für US-Regionen

Das Google Gemini 2.5 Pro-Modell, auf das über den OCI Generative AI-Service in US-Regionen zugegriffen werden kann, wird extern von Google gehostet. Daher führt ein Aufruf an ein Google Gemini 2.5 Pro-Modell (über den OCI Generative AI-Service) zu einem Aufruf an einen Google-Standort. Für Google Gemini 2.5 Pro wird ein regionaler Standort von Google Americas verwendet, der die Anforderung nur an einen Standort von Google Americas weiterleitet. Machine Learning Processing findet an einem Standort in Google Americas statt.

Wichtig

Externe Aufrufe an Gemini 2.5 Flash für US-Regionen

Das Gemini 2.5 Flash-Modell, auf das über den OCI Generative AI-Service in US-Regionen zugegriffen werden kann, wird extern von Google gehostet. Daher führt ein Aufruf an ein Gemini 2.5 Flash-Modell (über den OCI Generative AI-Service) zu einem Aufruf an einen Google-Standort. Für Gemini 2.5 Flash wird ein regionaler Standort von Google Americas verwendet, der die Anforderung nur an einen Standort von Google Americas weiterleitet. Machine Learning Processing findet an einem Standort in Google Americas statt.

Wichtig

Externe Aufrufe an Gemini 2.5 Flash-Lite für US-Regionen

Das Gemini 2.5 Flash-Lite-Modell, auf das über den OCI Generative AI-Service in US-Regionen zugegriffen werden kann, wird extern von Google gehostet. Daher führt ein Aufruf an ein Gemini 2.5 Flash-Lite-Modell (über den OCI Generative AI-Service) zu einem Aufruf an einen Google-Standort. Für Gemini 2.5 Flash-Lite wird ein regionaler Standort von Google Americas verwendet, der die Anforderung nur an einen Standort von Google Americas weiterleitet. Machine Learning Processing findet an einem Standort in Google Americas statt.