Modèles et régions d'IA générative pour l'API Agentic
Cette page répertorie le sous-ensemble de modèles et de régions préentraînés pris en charge pour les fonctionnalités agénétiques dans OCI Generative AI.
Les caractéristiques agénétiques incluent :
- Inférence agénétique (appels de discussion d'exécution) utilisée par les agents lors de l'exécution.
- Modèles de mémoire de projet utilisés lorsque vous ajoutez une extraction de mémoire à long terme et une compaction de mémoire à court terme à un projet OCI Generative AI.
1. Modèles d'inférence agénétique (exécution)
Modèles de discussion disponibles pour les agents
Les agents peuvent appeler les modèles de discussion suivants pour les cas d'utilisation d'inférence agénétique :
- Plateforme IA Google Vertex
- OpenAI Open Source
- Plate-forme xAI
Régions disponibles
Vous pouvez accéder aux modèles d'inférence agénétique dans une ou plusieurs des régions OC1 suivantes :
- Amérique du Nord
-
- Est des Etats-Unis (Ashburn)
- Midwest des Etats-Unis (Chicago)
- Ouest des Etats-Unis (Phoenix)
- Amérique du Sud
-
- Est du Brésil (São Paulo)
- Europe (UE)
-
- Allemagne centrale (Francfort)
- Sud du Royaume-Uni (Londres)
- Moyen-Orient (ME)
-
- Centre de l'Arabie saoudite (Riyad)
-
Remarque
L'API Agentic n'est pas disponible dans l'est des Emirats arabes unis (Dubaï).
- Asie Pacifique (AP)
-
- Sud de l'Inde (Hyderabad)
- Centre du Japon (Osaka)
Tous les modèles ne sont pas disponibles dans toutes les régions de la liste précédente. Pour plus d'informations sur les régions prises en charge par modèle et le déploiement, reportez-vous à la page Modèles par région.
Modèles de mémoire de projet (paramètres de projet)
Lorsque vous créez un projet et activez les fonctionnalités de mémoire, vous sélectionnez des modèles pour :
- Compaction de mémoire à court terme (compaction d'historique de conversation)
- Extraction de mémoire à long terme (a pour but d'extraire les informations clés des conversations)
- Intégrations de mémoire à long terme (stockage des mémoires extraites en tant que vecteurs recherchables)
2.1 Compaction de mémoire à court terme (compaction d'historique de conversation)
Les projets peuvent utiliser les modèles suivants pour le compactage de la mémoire à court terme :
| Région | Code région | Modèle intégré |
|---|---|---|
| Est du Brésil (São Paulo) | sa-saopaulo-1 |
|
| Allemagne centrale (Francfort) | eu-frankfurt-1 |
|
| Sud du Royaume-Uni (Londres) | uk-london-1 |
|
| Sud de l'Inde (Hyderabad) | ap-hyderabad-1 |
|
| Est des Etats-Unis (Ashburn) (cross region to Midwest des Etats-Unis (Chicago) | us-ahsburn-1 (inter-région vers us-chicago-1) |
|
| Centre du Japon (Osaka) | ap-osaka-1 |
|
| Centre de l'Arabie saoudite (Riyad) | me-riyadh-1 |
|
| Midwest des Etats-Unis (Chicago) | us-chicago-1 |
|
| Ouest des Etats-Unis (Phoenix) (cross region to Midwest des Etats-Unis (Chicago) | us-phoenix-1(inter-région vers us-chicago-1) |
|
2.2 Mémoire à long terme
- Modèle d'extraction (toutes les régions prises en charge)
- OpenAI gpt-oss-120b
- Modèle de plongement
-
Le modèle d'intégration utilisé pour stocker des mémoires extraites en tant que vecteurs recherchables dépend de la région Projet :
Région Code région Modèle intégré Est du Brésil (São Paulo) sa-saopaulo-1Cohere Embed Multilingue 3 Allemagne centrale (Francfort) eu-frankfurt-1Cohere Embed Multilingue 3 Sud du Royaume-Uni (Londres) uk-london-1Cohere Embed Multilingue 3 Sud de l'Inde (Hyderabad) ap-hyderabad-1Image multilingue 3 de Cohere Embed Est des Etats-Unis (Ashburn) (cross region to Midwest des Etats-Unis (Chicago) Voir appels externes
us-ahsburn-1(inter-région versus-chicago-1)Cohere Embed 4 Centre du Japon (Osaka) ap-osaka-1Cohere Embed 4 Centre de l'Arabie saoudite (Riyad) me-riyadh-1Cohere Embed 4 Midwest des Etats-Unis (Chicago) us-chicago-1Cohere Embed 4 Ouest des Etats-Unis (Phoenix) (cross region to Midwest des Etats-Unis (Chicago) Voir appels externes
us-phoenix-1(inter-région versus-chicago-1)Cohere Embed 4
Notes et limites connues
- Est des Emirats arabes unis (Dubaï) : l'API Agentic n'est pas disponible dans cette région.
- Disponibilité : les régions répertoriées pour les modèles d'inférence agénétique sur cette page indiquent où les fonctionnalités agénétiques sont prises en charge. La disponibilité des modèles individuels peut toujours varier dans ces régions.
Appels externes aux modèles Google
Appels externes à Google Gemini 2.5 Pro pour les régions des Etats-Unis
Le modèle Google Gemini 2.5 Pro accessible via le service OCI Generative AI dans les régions américaines est hébergé en externe par Google. Par conséquent, un appel à un modèle Google Gemini 2.5 Pro (via le service OCI Generative AI) entraîne un appel vers un emplacement Google. Pour Google Gemini 2.5 Pro, un emplacement régional de Google Americas est utilisé, qui achemine la demande vers un emplacement de Google Americas uniquement. Le traitement de l'apprentissage automatique a lieu dans un site Google Americas.
Appels externes à Gemini 2.5 Flash pour les régions des Etats-Unis
Le modèle Gemini 2.5 Flash accessible via le service OCI Generative AI dans les régions américaines est hébergé en externe par Google. Par conséquent, un appel à un modèle Gemini 2.5 Flash (via le service OCI Generative AI) entraîne un appel vers un emplacement Google. Pour Gemini 2.5 Flash, un emplacement régional de Google Americas est utilisé, qui achemine la demande vers un emplacement de Google Americas uniquement. Le traitement de l'apprentissage automatique a lieu dans un site Google Americas.
Appels externes à Gemini 2.5 Flash-Lite pour les régions des Etats-Unis
Le modèle Gemini 2.5 Flash-Lite accessible via le service OCI Generative AI dans les régions américaines est hébergé en externe par Google. Par conséquent, un appel à un modèle Gemini 2.5 Flash-Lite (via le service OCI Generative AI) entraîne un appel vers un emplacement Google. Pour Gemini 2.5 Flash-Lite, un emplacement régional de Google Americas est utilisé, qui achemine la demande vers un emplacement de Google Americas uniquement. Le traitement de l'apprentissage automatique a lieu dans un site Google Americas.