Modèles et régions d'IA générative pour l'API Agentic
Cette page répertorie le sous-ensemble de modèles et de régions préentraînés pris en charge pour les fonctions générales de l'intelligence artificielle générative pour OCI.
Les fonctionnalités Agentic incluent :
- Inférence agentique (appels de clavardage d'exécution) utilisée par les agents lors de l'exécution.
- Modèles de mémoire de projet utilisés lorsque vous ajoutez une extraction de mémoire à long terme et un compartiment de mémoire à court terme à un projet d'OCI Generative AI.
1. Modèles d'inférence agéntique (d'exécution)
Modèles de clavardage disponibles pour les agents
Les agents peuvent appeler les modèles de clavardage suivants pour les cas d'utilisation d'inférence agéntique :
- Plateforme d'intelligence artificielle de Google Vertex
- Source ouverte OpenAI
- Plateforme xAI
Régions disponibles
Vous pouvez accéder aux modèles d'inférence agéntique dans une ou plusieurs des régions OC1 suivantes :
- Amérique du Nord
-
- États-Unis - Est (Ashburn)
- États-Unis - Midwest (Chicago)
- États-Unis - Ouest (Phoenix)
- Amérique du Sud
-
- Brésil - Est (Sao Paulo)
- Europe (UE)
-
- Allemagne - Centre (Francfort)
- Royaume-Uni - Sud (Londres)
- Moyen-Orient (ME)
-
- Centre de l'Arabie saoudite (Riyad)
-
Note
L'API Agentic n'est pas disponible dans les Émirats arabes unis - Est (Dubaï).
- Asie-Pacifique (AP)
-
- Inde - Sud (Hyderabad)
- Japon - Centre (Osaka)
Tous les modèles ne sont pas disponibles dans toutes les régions de la liste précédente. Pour les régions prises en charge par modèle et les détails du déploiement, voir la page Modèles par région.
Modèles de mémoire de projet (paramètres de projet)
Lorsque vous créez un projet et activez les fonctions de mémoire, vous sélectionnez des modèles pour :
- Comparaison de mémoire à court terme (comparaison de l'historique des conversations)
- Extraction de mémoire à long terme (a pour but d'extraire des informations clés des conversations)
- Intégrations de mémoire à long terme (enregistre les mémoires extraites en tant que vecteurs interrogeables)
2.1 Compaction de la mémoire à court terme (compaction de l'historique des conversations)
Les projets peuvent utiliser les modèles suivants pour le compactage de la mémoire à court terme :
| Région | Code de la région | Intégrer un modèle |
|---|---|---|
| Brésil - Est (Sao Paulo) | sa-saopaulo-1 |
|
| Allemagne - Centre (Francfort) | eu-frankfurt-1 |
|
| Royaume-Uni - Sud (Londres) | uk-london-1 |
|
| Inde - Sud (Hyderabad) | ap-hyderabad-1 |
|
| Est des États-Unis (Ashburn) (cross region to États-Unis Midwest (Chicago) | us-ahsburn-1 (entre les régions et us-chicago-1) |
|
| Japon - Centre (Osaka) | ap-osaka-1 |
|
| Centre de l'Arabie saoudite (Riyad) | me-riyadh-1 |
|
| États-Unis - Midwest (Chicago) | us-chicago-1 |
|
| Ouest des États-Unis (Phoenix) (cross region to États-Unis Midwest (Chicago) | us-phoenix-1(inter-région à us-chicago-1) |
|
2.2 Mémoire à long terme
- Modèle d'extraction (toutes les régions prises en charge)
- OpenAI gpt-oss-120b
- Modèle d'intégration
-
Le modèle d'intégration utilisé pour stocker les mémoire extraite en tant que vecteurs interrogeables dépend de la région Projet :
Région Code de la région Intégrer un modèle Brésil - Est (Sao Paulo) sa-saopaulo-1Cohere Embed multilingue 3 Allemagne - Centre (Francfort) eu-frankfurt-1Cohere Embed multilingue 3 Royaume-Uni - Sud (Londres) uk-london-1Cohere Embed multilingue 3 Inde - Sud (Hyderabad) ap-hyderabad-1Cohere Embed Image multilingue 3 Est des États-Unis (Ashburn) (cross region to États-Unis Midwest (Chicago) Voir Appels externes
us-ahsburn-1(entre les régions etus-chicago-1)Cohere Embed 4 Japon - Centre (Osaka) ap-osaka-1Cohere Embed 4 Centre de l'Arabie saoudite (Riyad) me-riyadh-1Cohere Embed 4 États-Unis - Midwest (Chicago) us-chicago-1Cohere Embed 4 Ouest des États-Unis (Phoenix) (cross region to États-Unis Midwest (Chicago) Voir Appels externes
us-phoenix-1(entre les régions etus-chicago-1)Cohere Embed 4
Notes et limites connues
- Émirats arabes unis - Est (Dubaï) : L'API Agentic n'est pas disponible dans cette région.
- Disponibilité : Les régions listées pour les modèles d'inférence agéntique dans cette page indiquent où les fonctions agéntiques sont prises en charge. La disponibilité des modèles individuels peut encore varier dans ces régions.
Appels externes aux modèles Google
Appels externes à Google Gemini 2.5 Pro pour les régions des États-Unis
Le modèle Google Gemini 2.5 Pro accessible au moyen du service d'intelligence artificielle générative pour OCI dans les régions des États-Unis est hébergé à l'externe par Google. Par conséquent, un appel à un modèle Google Gemini 2.5 Pro (au moyen du service d'intelligence artificielle générative pour OCI) entraîne un appel à un emplacement Google. Pour Google Gemini 2.5 Pro, un emplacement régional Google Americas est utilisé, qui achemine la demande uniquement vers un emplacement Google Americas. Le traitement de l'apprentissage automatique a lieu dans un emplacement Google Americas.
Appels externes à Gemini 2.5 Flash pour les régions des États-Unis
Le modèle Gemini 2.5 Flash accessible au moyen du service d'intelligence artificielle générative pour OCI dans les régions des États-Unis est hébergé à l'externe par Google. Par conséquent, un appel à un modèle Gemini 2.5 Flash (au moyen du service d'intelligence artificielle générative pour OCI) entraîne un appel à un emplacement Google. Pour Gemini 2.5 Flash, un emplacement régional Google Americas est utilisé, qui achemine la demande uniquement vers un emplacement Google Americas. Le traitement de l'apprentissage automatique a lieu dans un emplacement Google Americas.
Appels externes à Gemini 2.5 Flash-Lite pour les régions des États-Unis
Le modèle Gemini 2.5 Flash-Lite accessible au moyen du service d'intelligence artificielle générative pour OCI dans les régions des États-Unis est hébergé à l'externe par Google. Par conséquent, un appel à un modèle Gemini 2.5 Flash-Lite (au moyen du service d'intelligence artificielle générative pour OCI) entraîne un appel à un emplacement Google. Pour Gemini 2.5 Flash-Lite, un emplacement régional Google Americas est utilisé, qui achemine la demande uniquement vers un emplacement Google Americas. Le traitement de l'apprentissage automatique a lieu dans un emplacement Google Americas.