Modèles et régions d'IA générative pour l'API Agentic

Cette page répertorie le sous-ensemble de modèles et de régions préentraînés pris en charge pour les fonctions générales de l'intelligence artificielle générative pour OCI.

Les fonctionnalités Agentic incluent :

  • Inférence agentique (appels de clavardage d'exécution) utilisée par les agents lors de l'exécution.
  • Modèles de mémoire de projet utilisés lorsque vous ajoutez une extraction de mémoire à long terme et un compartiment de mémoire à court terme à un projet d'OCI Generative AI.

1. Modèles d'inférence agéntique (d'exécution)

Modèles de clavardage disponibles pour les agents

Les agents peuvent appeler les modèles de clavardage suivants pour les cas d'utilisation d'inférence agéntique :

Plateforme d'intelligence artificielle de Google Vertex
Source ouverte OpenAI
Plateforme xAI

Régions disponibles

Vous pouvez accéder aux modèles d'inférence agéntique dans une ou plusieurs des régions OC1 suivantes :

Amérique du Nord
  • États-Unis - Est (Ashburn)
  • États-Unis - Midwest (Chicago)
  • États-Unis - Ouest (Phoenix)
Amérique du Sud
  • Brésil - Est (Sao Paulo)
Europe (UE)
  • Allemagne - Centre (Francfort)
  • Royaume-Uni - Sud (Londres)
Moyen-Orient (ME)
  • Centre de l'Arabie saoudite (Riyad)
  • Note

    L'API Agentic n'est pas disponible dans les Émirats arabes unis - Est (Dubaï).
Asie-Pacifique (AP)
  • Inde - Sud (Hyderabad)
  • Japon - Centre (Osaka)
Important

Tous les modèles ne sont pas disponibles dans toutes les régions de la liste précédente. Pour les régions prises en charge par modèle et les détails du déploiement, voir la page Modèles par région.

Modèles de mémoire de projet (paramètres de projet)

Lorsque vous créez un projet et activez les fonctions de mémoire, vous sélectionnez des modèles pour :

  • Comparaison de mémoire à court terme (comparaison de l'historique des conversations)
  • Extraction de mémoire à long terme (a pour but d'extraire des informations clés des conversations)
  • Intégrations de mémoire à long terme (enregistre les mémoires extraites en tant que vecteurs interrogeables)

2.1 Compaction de la mémoire à court terme (compaction de l'historique des conversations)

Les projets peuvent utiliser les modèles suivants pour le compactage de la mémoire à court terme :

Région Code de la région Intégrer un modèle
Brésil - Est (Sao Paulo) sa-saopaulo-1
Métadonnées
Source ouverte OpenAI
Allemagne - Centre (Francfort) eu-frankfurt-1
Plateforme d'intelligence artificielle de Google Vertex
Métadonnées
Source ouverte OpenAI
Royaume-Uni - Sud (Londres) uk-london-1
Plateforme d'intelligence artificielle de Google Vertex
Métadonnées
Source ouverte OpenAI
Inde - Sud (Hyderabad) ap-hyderabad-1
Plateforme d'intelligence artificielle de Google Vertex
Métadonnées
Source ouverte OpenAI
Est des États-Unis (Ashburn) (cross region to États-Unis Midwest (Chicago) us-ahsburn-1 (entre les régions et us-chicago-1)
Plateforme d'intelligence artificielle de Google Vertex
Métadonnées
Source ouverte OpenAI
Japon - Centre (Osaka) ap-osaka-1
Plateforme d'intelligence artificielle de Google Vertex
Métadonnées
Source ouverte OpenAI
Centre de l'Arabie saoudite (Riyad) me-riyadh-1
Métadonnées
Source ouverte OpenAI
États-Unis - Midwest (Chicago) us-chicago-1
Plateforme d'intelligence artificielle de Google Vertex
Métadonnées
Source ouverte OpenAI
Ouest des États-Unis (Phoenix) (cross region to États-Unis Midwest (Chicago) us-phoenix-1(inter-région à us-chicago-1)
Plateforme d'intelligence artificielle de Google Vertex
Métadonnées
Source ouverte OpenAI

2.2 Mémoire à long terme

Modèle d'extraction (toutes les régions prises en charge)
OpenAI gpt-oss-120b
Modèle d'intégration

Le modèle d'intégration utilisé pour stocker les mémoire extraite en tant que vecteurs interrogeables dépend de la région Projet :

Région Code de la région Intégrer un modèle
Brésil - Est (Sao Paulo) sa-saopaulo-1 Cohere Embed multilingue 3
Allemagne - Centre (Francfort) eu-frankfurt-1 Cohere Embed multilingue 3
Royaume-Uni - Sud (Londres) uk-london-1 Cohere Embed multilingue 3
Inde - Sud (Hyderabad) ap-hyderabad-1 Cohere Embed Image multilingue 3
Est des États-Unis (Ashburn) (cross region to États-Unis Midwest (Chicago)

Voir Appels externes

us-ahsburn-1 (entre les régions et us-chicago-1) Cohere Embed 4
Japon - Centre (Osaka) ap-osaka-1 Cohere Embed 4
Centre de l'Arabie saoudite (Riyad) me-riyadh-1 Cohere Embed 4
États-Unis - Midwest (Chicago) us-chicago-1 Cohere Embed 4
Ouest des États-Unis (Phoenix) (cross region to États-Unis Midwest (Chicago)

Voir Appels externes

us-phoenix-1 (entre les régions et us-chicago-1) Cohere Embed 4

Notes et limites connues

  • Émirats arabes unis - Est (Dubaï) : L'API Agentic n'est pas disponible dans cette région.
  • Disponibilité : Les régions listées pour les modèles d'inférence agéntique dans cette page indiquent où les fonctions agéntiques sont prises en charge. La disponibilité des modèles individuels peut encore varier dans ces régions.

Appels externes aux modèles Google

Important

Appels externes à Google Gemini 2.5 Pro pour les régions des États-Unis

Le modèle Google Gemini 2.5 Pro accessible au moyen du service d'intelligence artificielle générative pour OCI dans les régions des États-Unis est hébergé à l'externe par Google. Par conséquent, un appel à un modèle Google Gemini 2.5 Pro (au moyen du service d'intelligence artificielle générative pour OCI) entraîne un appel à un emplacement Google. Pour Google Gemini 2.5 Pro, un emplacement régional Google Americas est utilisé, qui achemine la demande uniquement vers un emplacement Google Americas. Le traitement de l'apprentissage automatique a lieu dans un emplacement Google Americas.

Important

Appels externes à Gemini 2.5 Flash pour les régions des États-Unis

Le modèle Gemini 2.5 Flash accessible au moyen du service d'intelligence artificielle générative pour OCI dans les régions des États-Unis est hébergé à l'externe par Google. Par conséquent, un appel à un modèle Gemini 2.5 Flash (au moyen du service d'intelligence artificielle générative pour OCI) entraîne un appel à un emplacement Google. Pour Gemini 2.5 Flash, un emplacement régional Google Americas est utilisé, qui achemine la demande uniquement vers un emplacement Google Americas. Le traitement de l'apprentissage automatique a lieu dans un emplacement Google Americas.

Important

Appels externes à Gemini 2.5 Flash-Lite pour les régions des États-Unis

Le modèle Gemini 2.5 Flash-Lite accessible au moyen du service d'intelligence artificielle générative pour OCI dans les régions des États-Unis est hébergé à l'externe par Google. Par conséquent, un appel à un modèle Gemini 2.5 Flash-Lite (au moyen du service d'intelligence artificielle générative pour OCI) entraîne un appel à un emplacement Google. Pour Gemini 2.5 Flash-Lite, un emplacement régional Google Americas est utilisé, qui achemine la demande uniquement vers un emplacement Google Americas. Le traitement de l'apprentissage automatique a lieu dans un emplacement Google Americas.