Modèles et régions d'IA générative pour les agents d'IA d'entreprise

Les agents d'IA d'entreprise dans OCI Generative AI prennent en charge un sous-ensemble de modèles et de régions préentraînés OCI Generative AI. Cette page répertorie les modèles et régions pris en charge pour l'inférence agénétique d'exécution et la mémoire de projet.

Pour appeler des modèles

Pour les adresses et les outils compatibles OCI-OpenAI
Remarque

Les modèles suivants sont pris en charge pour les adresses compatibles avec OCI OpenAI et les outils compatibles avec OpenAI.

Modèles de discussion disponibles

Les agents peuvent appeler les modèles de discussion suivants pour les cas d'utilisation d'inférence agénétique :

Plateforme IA Google Vertex
OpenAI Open Source
Plate-forme xAI
Important

Appels externes aux modèles Grok xAI

Les modèles xAI Grok sont hébergés dans un centre de données OCI, dans une location provisionnée pour xAI. Les modèles xAI Grok, accessibles via le service OCI Generative AI, sont gérés par xAI.

Régions commerciales disponibles (OC1)

Vous pouvez accéder aux modèles d'inférence agénétique dans une ou plusieurs des régions OC1 suivantes :

Nom de région Lieu Identifiant de la région Clé de la région
Est du Brésil (São Paulo) São Paulo sa-saopaulo-1 GRU
Allemagne centrale (Francfort) Francfort eu-frankfurt-1 FRA
Sud de l'Inde (Hyderabad) Hyderabad ap-hyderabad-1 HYD
Centre du Japon (Osaka) Osaka ap-osaka-1 KIX
Centre de l'Arabie saoudite (Riyad) Riyad me-riyadh-1 RUH
Sud du Royaume-Uni (Londres) Londres uk-london-1 LHR
Est des Etats-Unis (Ashburn) Ashburn us-ashburn-1 IAD
Midwest des Etats-Unis (Chicago) Chicago us-chicago-1 ORD
Ouest des Etats-Unis (Phoenix) Phoenix us-phoenix-1 PHX

En savoir plus sur A propos des régions et des domaines de disponible.

Remarque

  • Est des Émirats arabes unis (Dubaï) : les adresses et outils compatibles OCI-OpenAI ne sont pas disponibles dans cette région.
  • Disponibilité : tous les modèles répertoriés ne sont pas disponibles dans les régions répertoriées ci-dessus. Pour plus d'informations sur les régions prises en charge par modèle et le déploiement, reportez-vous à la page Modèles par région.
  • Appels externes : pour obtenir des notes sur les modèles avec des appels externes, voir Appels externes.

Pour activer la mémoire du projet

Pour le compactage de la mémoire à court terme (historique des conversations)

Lorsque vous créez un projet, vous pouvez activer la compression de mémoire à court terme pour les conversations et les réponses liées à ce projet. Reportez-vous au tableau suivant pour connaître les modèles et régions disponibles pour le compactage de la mémoire.

Région Code région Modèle mémoire à court terme
Est du Brésil (São Paulo) sa-saopaulo-1
Allemagne centrale (Francfort) eu-frankfurt-1
Sud du Royaume-Uni (Londres) uk-london-1
Sud de l'Inde (Hyderabad) ap-hyderabad-1
Est des Etats-Unis (Ashburn) (cross region to Midwest des Etats-Unis (Chicago) us-ahsburn-1 (inter-région vers us-chicago-1)
Centre du Japon (Osaka) ap-osaka-1
Centre de l'Arabie saoudite (Riyad) me-riyadh-1
Midwest des Etats-Unis (Chicago) us-chicago-1
Ouest des Etats-Unis (Phoenix) (cross region to Midwest des Etats-Unis (Chicago) us-phoenix-1(inter-région vers us-chicago-1)

Pour extraire des informations clés pour la mémoire à long terme

chapeau

Lorsque vous créez un projet, vous pouvez activer l'extraction d'informations à partir de conversations et de réponses pour une fonctionnalité de mémoire à long terme. Vous sélectionnez un modèle d'extraction qui vise à extraire les informations clés des conversations. Reportez-vous au tableau suivant pour les régions et le modèle pris en charge pour l'extraction des informations clés à utiliser pour la mémoire à long terme.

Région Modèle d'extraction disponible
Référence croisée Régions commerciales disponibles (OC1) avec les régions pour lesquelles OpenAI gpt-oss-120b est disponible OpenAI gpt-oss-120b
Pour stocker des informations clés en tant qu'embeddings pour la mémoire à long terme

Lorsque vous créez un projet, vous pouvez sélectionner un modèle d'intégration pour stocker les mémoires extraites en tant que vecteurs recherchables. Le modèle d'intégration disponible dépend de la région du projet. Reportez-vous au tableau suivant pour connaître le modèle d'intégration disponible dans chaque région :

Région Code région Modèle intégré disponible
Est du Brésil (São Paulo) sa-saopaulo-1 Cohere Embed Multilingual 3 (en phase d'abandon)
Allemagne centrale (Francfort) eu-frankfurt-1 Cohere Embed Multilingual 3 (en phase d'abandon)
Sud du Royaume-Uni (Londres) uk-london-1 Cohere Embed Multilingual 3 (en phase d'abandon)
Sud de l'Inde (Hyderabad) ap-hyderabad-1 Cohere Embed Multilingual Image 3 (en phase d'abandon)
Est des Etats-Unis (Ashburn) (cross region to Midwest des Etats-Unis (Chicago) us-ahsburn-1 Cohere Embed 4
Centre du Japon (Osaka) ap-osaka-1 Cohere Embed 4
Centre de l'Arabie saoudite (Riyad) me-riyadh-1 Cohere Embed 4
Midwest des Etats-Unis (Chicago) us-chicago-1 Cohere Embed 4
Ouest des Etats-Unis (Phoenix) (cross region to Midwest des Etats-Unis (Chicago) us-phoenix-1 Cohere Embed 4

Appels externes

Appels externes aux modèles Grok xAI

Important

Appels externes aux modèles Grok xAI

Les modèles xAI Grok sont hébergés dans un centre de données OCI, dans une location provisionnée pour xAI. Les modèles xAI Grok, accessibles via le service OCI Generative AI, sont gérés par xAI.

Appels externes aux modèles Google

Important

Appels externes à Google Gemini 2.5 Pro pour les régions des Etats-Unis

Le modèle Google Gemini 2.5 Pro accessible via le service OCI Generative AI dans les régions américaines est hébergé en externe par Google. Par conséquent, un appel à un modèle Google Gemini 2.5 Pro (via le service OCI Generative AI) entraîne un appel vers un emplacement Google. Pour Google Gemini 2.5 Pro, un emplacement régional de Google Americas est utilisé, qui achemine la demande vers un emplacement de Google Americas uniquement. Le traitement de l'apprentissage automatique a lieu dans un site Google Americas.

Important

Appels externes à Gemini 2.5 Flash pour les régions des Etats-Unis

Le modèle Gemini 2.5 Flash accessible via le service OCI Generative AI dans les régions américaines est hébergé en externe par Google. Par conséquent, un appel à un modèle Gemini 2.5 Flash (via le service OCI Generative AI) entraîne un appel vers un emplacement Google. Pour Gemini 2.5 Flash, un emplacement régional de Google Americas est utilisé, qui achemine la demande vers un emplacement de Google Americas uniquement. Le traitement de l'apprentissage automatique a lieu dans un site Google Americas.

Important

Appels externes à Gemini 2.5 Flash-Lite pour les régions des Etats-Unis

Le modèle Gemini 2.5 Flash-Lite accessible via le service OCI Generative AI dans les régions américaines est hébergé en externe par Google. Par conséquent, un appel à un modèle Gemini 2.5 Flash-Lite (via le service OCI Generative AI) entraîne un appel vers un emplacement Google. Pour Gemini 2.5 Flash-Lite, un emplacement régional de Google Americas est utilisé, qui achemine la demande vers un emplacement de Google Americas uniquement. Le traitement de l'apprentissage automatique a lieu dans un site Google Americas.