Modèles et régions d'IA générative pour l'API Agentic

Cette page répertorie le sous-ensemble de modèles et de régions préentraînés pris en charge pour les fonctionnalités agénétiques dans OCI Generative AI.

Les caractéristiques agénétiques incluent :

  • Inférence agénétique (appels de discussion d'exécution) utilisée par les agents lors de l'exécution.
  • Modèles de mémoire de projet utilisés lorsque vous ajoutez une extraction de mémoire à long terme et une compaction de mémoire à court terme à un projet OCI Generative AI.

1. Modèles d'inférence agénétique (exécution)

Régions disponibles

Vous pouvez accéder aux modèles d'inférence agénétique dans une ou plusieurs des régions OC1 suivantes :

Amérique du Nord
  • Est des Etats-Unis (Ashburn)
  • Midwest des Etats-Unis (Chicago)
  • Ouest des Etats-Unis (Phoenix)
Amérique du Sud
  • Est du Brésil (São Paulo)
Europe (UE)
  • Allemagne centrale (Francfort)
  • Sud du Royaume-Uni (Londres)
Moyen-Orient (ME)
  • Centre de l'Arabie saoudite (Riyad)
  • Remarque

    L'API Agentic n'est pas disponible dans l'est des Emirats arabes unis (Dubaï).
Asie Pacifique (AP)
  • Sud de l'Inde (Hyderabad)
  • Centre du Japon (Osaka)
Important

Tous les modèles ne sont pas disponibles dans toutes les régions de la liste précédente. Pour plus d'informations sur les régions prises en charge par modèle et le déploiement, reportez-vous à la page Modèles par région.

Modèles de mémoire de projet (paramètres de projet)

Lorsque vous créez un projet et activez les fonctionnalités de mémoire, vous sélectionnez des modèles pour :

  • Compaction de mémoire à court terme (compaction d'historique de conversation)
  • Extraction de mémoire à long terme (a pour but d'extraire les informations clés des conversations)
  • Intégrations de mémoire à long terme (stockage des mémoires extraites en tant que vecteurs recherchables)

2.1 Compaction de mémoire à court terme (compaction d'historique de conversation)

Les projets peuvent utiliser les modèles suivants pour le compactage de la mémoire à court terme :

Région Code région Modèle intégré
Est du Brésil (São Paulo) sa-saopaulo-1
Méta
OpenAI Open Source
Allemagne centrale (Francfort) eu-frankfurt-1
Plateforme IA Google Vertex
Méta
OpenAI Open Source
Sud du Royaume-Uni (Londres) uk-london-1
Plateforme IA Google Vertex
Méta
OpenAI Open Source
Sud de l'Inde (Hyderabad) ap-hyderabad-1
Plateforme IA Google Vertex
Méta
OpenAI Open Source
Est des Etats-Unis (Ashburn) (cross region to Midwest des Etats-Unis (Chicago) us-ahsburn-1 (inter-région vers us-chicago-1)
Plateforme IA Google Vertex
Méta
OpenAI Open Source
Centre du Japon (Osaka) ap-osaka-1
Plateforme IA Google Vertex
Méta
OpenAI Open Source
Centre de l'Arabie saoudite (Riyad) me-riyadh-1
Méta
OpenAI Open Source
Midwest des Etats-Unis (Chicago) us-chicago-1
Plateforme IA Google Vertex
Méta
OpenAI Open Source
Ouest des Etats-Unis (Phoenix) (cross region to Midwest des Etats-Unis (Chicago) us-phoenix-1(inter-région vers us-chicago-1)
Plateforme IA Google Vertex
Méta
OpenAI Open Source

2.2 Mémoire à long terme

Modèle d'extraction (toutes les régions prises en charge)
OpenAI gpt-oss-120b
Modèle de plongement

Le modèle d'intégration utilisé pour stocker des mémoires extraites en tant que vecteurs recherchables dépend de la région Projet :

Région Code région Modèle intégré
Est du Brésil (São Paulo) sa-saopaulo-1 Cohere Embed Multilingue 3
Allemagne centrale (Francfort) eu-frankfurt-1 Cohere Embed Multilingue 3
Sud du Royaume-Uni (Londres) uk-london-1 Cohere Embed Multilingue 3
Sud de l'Inde (Hyderabad) ap-hyderabad-1 Image multilingue 3 de Cohere Embed
Est des Etats-Unis (Ashburn) (cross region to Midwest des Etats-Unis (Chicago)

Voir appels externes

us-ahsburn-1 (inter-région vers us-chicago-1) Cohere Embed 4
Centre du Japon (Osaka) ap-osaka-1 Cohere Embed 4
Centre de l'Arabie saoudite (Riyad) me-riyadh-1 Cohere Embed 4
Midwest des Etats-Unis (Chicago) us-chicago-1 Cohere Embed 4
Ouest des Etats-Unis (Phoenix) (cross region to Midwest des Etats-Unis (Chicago)

Voir appels externes

us-phoenix-1 (inter-région vers us-chicago-1) Cohere Embed 4

Notes et limites connues

  • Est des Emirats arabes unis (Dubaï) : l'API Agentic n'est pas disponible dans cette région.
  • Disponibilité : les régions répertoriées pour les modèles d'inférence agénétique sur cette page indiquent où les fonctionnalités agénétiques sont prises en charge. La disponibilité des modèles individuels peut toujours varier dans ces régions.

Appels externes aux modèles Google

Important

Appels externes à Google Gemini 2.5 Pro pour les régions des Etats-Unis

Le modèle Google Gemini 2.5 Pro accessible via le service OCI Generative AI dans les régions américaines est hébergé en externe par Google. Par conséquent, un appel à un modèle Google Gemini 2.5 Pro (via le service OCI Generative AI) entraîne un appel vers un emplacement Google. Pour Google Gemini 2.5 Pro, un emplacement régional de Google Americas est utilisé, qui achemine la demande vers un emplacement de Google Americas uniquement. Le traitement de l'apprentissage automatique a lieu dans un site Google Americas.

Important

Appels externes à Gemini 2.5 Flash pour les régions des Etats-Unis

Le modèle Gemini 2.5 Flash accessible via le service OCI Generative AI dans les régions américaines est hébergé en externe par Google. Par conséquent, un appel à un modèle Gemini 2.5 Flash (via le service OCI Generative AI) entraîne un appel vers un emplacement Google. Pour Gemini 2.5 Flash, un emplacement régional de Google Americas est utilisé, qui achemine la demande vers un emplacement de Google Americas uniquement. Le traitement de l'apprentissage automatique a lieu dans un site Google Americas.

Important

Appels externes à Gemini 2.5 Flash-Lite pour les régions des Etats-Unis

Le modèle Gemini 2.5 Flash-Lite accessible via le service OCI Generative AI dans les régions américaines est hébergé en externe par Google. Par conséquent, un appel à un modèle Gemini 2.5 Flash-Lite (via le service OCI Generative AI) entraîne un appel vers un emplacement Google. Pour Gemini 2.5 Flash-Lite, un emplacement régional de Google Americas est utilisé, qui achemine la demande vers un emplacement de Google Americas uniquement. Le traitement de l'apprentissage automatique a lieu dans un site Google Americas.