Generative KI-Modelle und -Regionen für die Agent-API
Auf dieser Seite wird die Teilmenge der vortrainierten Modelle und Regionen aufgeführt, die für agentische Features in OCI Generative AI unterstützt werden.
Agentische Features umfassen:
- Agentische Inferenz (Laufzeitchataufrufe), die von Agents zur Laufzeit verwendet wird.
- Projektspeichermodelle, die verwendet werden, wenn Sie einem OCI Generative AI-Projekt eine Langzeitspeicherextraktion und eine Kurzzeitspeicherextraktion hinzufügen.
1. Agentische Inferenzmodelle (Laufzeit)
Verfügbare Chatmodelle für Agents
Agents können die folgenden Chatmodelle für Anwendungsfälle für Agentic Inference aufrufen:
- Google Vertex AI-Plattform
- OpenAI Open Source
- xAI-Plattform
Verfügbare Regionen
Sie können in mindestens einer der folgenden OC1-Regionen auf Agentic-Inferenzmodelle zugreifen:
- Nordamerika
-
- US East (Ashburn)
- US Midwest (Chicago)
- US West (Phoenix)
- Südamerika
-
- Brazil East (Sao Paulo)
- Europa (EU)
-
- Germany Central (Frankfurt)
- UK South (London)
- Naher Osten (ME)
-
- Saudi Arabia Central (Riad)
-
Hinweis
Die Agent-API ist in den VAE East (Dubai) nicht verfügbar.
- Asien-Pazifik (AP)
-
- India South (Hyderabad)
- Japan Central (Osaka)
Nicht jedes Modell ist in jeder Region in der oben aufgeführten Liste verfügbar. Unterstützte Regionen und Deployment-Details für jedes Modell finden Sie auf der Seite Modelle nach Region.
Projektspeichermodelle (Projekteinstellungen)
Wenn Sie ein Projekt erstellen und Speicherfunktionen aktivieren, wählen Sie Modelle für:
- Komprimierung des Kurzzeitgedächtnisses (Komprimierung der Gesprächshistorie)
- Langzeitgedächtnisextraktion (zielt darauf ab, wichtige Informationen aus Unterhaltungen zu extrahieren)
- Langfristige Speichereinbettungen (speichert extrahierte Speicher als durchsuchbare Vektoren)
2.1 Kurzzeitgedächtnisverdichtung (Konversationsverlaufsverdichtung)
Projekte können die folgenden Modelle für die Kurzzeitgedächtnisverdichtung verwenden:
| Region | Regions-Code | Modell einbetten |
|---|---|---|
| Brazil East (Sao Paulo) | sa-saopaulo-1 |
|
| Germany Central (Frankfurt) | eu-frankfurt-1 |
|
| UK South (London) | uk-london-1 |
|
| India South (Hyderabad) | ap-hyderabad-1 |
|
| US East (Ashburn) (regional zu US Midwest (Chicago) | us-ahsburn-1 (regionsübergreifend zu us-chicago-1) |
|
| Japan Central (Osaka) | ap-osaka-1 |
|
| Saudi Arabia Central (Riad) | me-riyadh-1 |
|
| US Midwest (Chicago) | us-chicago-1 |
|
| US West (Phoenix) (regional zu US Midwest (Chicago) | us-phoenix-1(regionsübergreifend nach us-chicago-1) |
|
2.2 Langfristiges Gedächtnis
- Extraktionsmodell (alle unterstützten Regionen)
- OpenAI gpt-oss-120b
- Einbettungsmodell
-
Das Einbettungsmodell, mit dem extrahierte Speicher als durchsuchbare Vektoren gespeichert werden, hängt vom Projektbereich ab:
Region Regions-Code Modell einbetten Brazil East (Sao Paulo) sa-saopaulo-1Cohere Einbettung Mehrsprachig 3 Germany Central (Frankfurt) eu-frankfurt-1Cohere Einbettung Mehrsprachig 3 UK South (London) uk-london-1Cohere Einbettung Mehrsprachig 3 India South (Hyderabad) ap-hyderabad-1Cohere Einbettung Mehrsprachiges Bild 3 US East (Ashburn) (regional zu US Midwest (Chicago) Siehe Externe Anrufe
us-ahsburn-1(regionsübergreifend zuus-chicago-1)Cohere Einbettung 4 Japan Central (Osaka) ap-osaka-1Cohere Einbettung 4 Saudi Arabia Central (Riad) me-riyadh-1Cohere Einbettung 4 US Midwest (Chicago) us-chicago-1Cohere Einbettung 4 US West (Phoenix) (regional zu US Midwest (Chicago) Siehe Externe Anrufe
us-phoenix-1(regionsübergreifend zuus-chicago-1)Cohere Einbettung 4
Hinweise und bekannte Einschränkungen
- VAE Ost (Dubai): Die Agent-API ist in dieser Region nicht verfügbar.
- Verfügbarkeit: Regionen, die für Agentic-Inferenzmodelle auf dieser Seite aufgeführt sind, geben an, wo Agentic-Features unterstützt werden. Die Verfügbarkeit einzelner Modelle kann innerhalb dieser Regionen noch variieren.
Externe Anrufe zu Google-Modellen
Externe Aufrufe an Google Gemini 2.5 Pro für US-Regionen
Das Google Gemini 2.5 Pro-Modell, auf das über den OCI Generative AI-Service in US-Regionen zugegriffen werden kann, wird extern von Google gehostet. Daher führt ein Aufruf an ein Google Gemini 2.5 Pro-Modell (über den OCI Generative AI-Service) zu einem Aufruf an einen Google-Standort. Für Google Gemini 2.5 Pro wird ein regionaler Standort von Google Americas verwendet, der die Anforderung nur an einen Standort von Google Americas weiterleitet. Machine Learning Processing findet an einem Standort in Google Americas statt.
Externe Aufrufe an Gemini 2.5 Flash für US-Regionen
Das Gemini 2.5 Flash-Modell, auf das über den OCI Generative AI-Service in US-Regionen zugegriffen werden kann, wird extern von Google gehostet. Daher führt ein Aufruf an ein Gemini 2.5 Flash-Modell (über den OCI Generative AI-Service) zu einem Aufruf an einen Google-Standort. Für Gemini 2.5 Flash wird ein regionaler Standort von Google Americas verwendet, der die Anforderung nur an einen Standort von Google Americas weiterleitet. Machine Learning Processing findet an einem Standort in Google Americas statt.
Externe Aufrufe an Gemini 2.5 Flash-Lite für US-Regionen
Das Gemini 2.5 Flash-Lite-Modell, auf das über den OCI Generative AI-Service in US-Regionen zugegriffen werden kann, wird extern von Google gehostet. Daher führt ein Aufruf an ein Gemini 2.5 Flash-Lite-Modell (über den OCI Generative AI-Service) zu einem Aufruf an einen Google-Standort. Für Gemini 2.5 Flash-Lite wird ein regionaler Standort von Google Americas verwendet, der die Anforderung nur an einen Standort von Google Americas weiterleitet. Machine Learning Processing findet an einem Standort in Google Americas statt.