Modèles et régions d'IA générative pour les agents d'IA d'entreprise

Les agents d'IA d'entreprise du service d'intelligence artificielle générative pour OCI prennent en charge un sous-ensemble de modèles et de régions prétraités du service d'IA générative pour OCI. Cette page répertorie les modèles et les régions pris en charge pour l'inférence agéntique d'exécution et la mémoire de projet.

Pour appeler des modèles

Pour les points d'extrémité et les outils compatibles avec OCI-OpenAI
Note

Les modèles suivants sont pris en charge pour les points d'extrémité compatibles avec OCI OpenAI et les outils compatibles avec OpenAI.

Modèles de clavardage disponibles

Les agents peuvent appeler les modèles de clavardage suivants pour les cas d'utilisation d'inférence agéntique :

Plateforme d'intelligence artificielle de Google Vertex
Source ouverte OpenAI
Plateforme xAI
Important

Appels externes aux modèles Grok xAI

Les modèles Grok xAI sont hébergés dans un centre de données OCI, dans une location provisionnée pour xAI. Les modèles Grok xAI, accessibles au moyen du service d'intelligence artificielle générative pour OCI, sont gérés par xAI.

Régions commerciales disponibles (OC1)

Vous pouvez accéder aux modèles d'inférence agéntique dans une ou plusieurs des régions OC1 suivantes :

Nom de la région Emplacement Identificateur de la région Clé de région
Brésil - Est (Sao Paulo) São Paulo sa-saopaulo-1 GRU
Allemagne - Centre (Francfort) Francfort eu-frankfurt-1 FRA
Inde - Sud (Hyderabad) Hyderabad ap-hyderabad-1 HYD
Japon - Centre (Osaka) Osaka ap-osaka-1 KIX
Centre de l'Arabie saoudite (Riyad) Riyad me-riyadh-1 RUH
Royaume-Uni - Sud (Londres) Londres uk-london-1 LHR
États-Unis - Est (Ashburn) Ashburn us-ashburn-1 IAD
États-Unis - Midwest (Chicago) Chicago us-chicago-1 ORD
États-Unis - Ouest (Phoenix) Phoenix us-phoenix-1 PHX

Découvrez À propos des régions et des domaines de disponibilité.

Note

  • Émirats arabes unis - Est (Dubaï) : Les points d'extrémité et les outils compatibles avec OCI-OpenAI ne sont pas disponibles dans cette région.
  • Disponibilité : Tous les modèles répertoriés ne sont pas disponibles dans les régions listées précédentes. Pour les régions prises en charge par modèle et les détails du déploiement, voir la page Modèles par région.
  • Appels externes : Pour des notes sur les modèles avec appels externes, voir Appels externes.
Pour les outils compatibles xAI
Note

Les modèles suivants sont pris en charge pour les outils compatibles avec xAI utilisés avec l'API de réponses OCI.

Régions prises en charge

Vous pouvez accéder aux modèles xAI en appelant les points d'extrémité dans les régions OC1 suivantes :

Nom de la région Emplacement Identificateur de la région Clé de région
États-Unis - Est (Ashburn) Ashburn us-ashburn-1 IAD
États-Unis - Midwest (Chicago) Chicago us-chicago-1 ORD
États-Unis - Ouest (Phoenix) Phoenix us-phoenix-1 PHX
Important

Appels externes aux modèles Grok xAI

Les modèles Grok xAI sont hébergés dans un centre de données OCI, dans une location provisionnée pour xAI. Les modèles Grok xAI, accessibles au moyen du service d'intelligence artificielle générative pour OCI, sont gérés par xAI.

Pour activer la mémoire du projet

Pour le compactage de mémoire à court terme (historique de conversation)

Lorsque vous créez un projet, vous pouvez activer le compactage de mémoire à court terme pour les conversations et les réponses liées à ce projet. Voir le tableau suivant pour les modèles et régions disponibles pour le compactage de la mémoire.

Région Code de la région Modèle de mémoire à court terme
Brésil - Est (Sao Paulo) sa-saopaulo-1
Allemagne - Centre (Francfort) eu-frankfurt-1
Royaume-Uni - Sud (Londres) uk-london-1
Inde - Sud (Hyderabad) ap-hyderabad-1
Est des États-Unis (Ashburn) (cross region to États-Unis Midwest (Chicago) us-ahsburn-1 (entre les régions et us-chicago-1)
Japon - Centre (Osaka) ap-osaka-1
Centre de l'Arabie saoudite (Riyad) me-riyadh-1
États-Unis - Midwest (Chicago) us-chicago-1
Ouest des États-Unis (Phoenix) (cross region to États-Unis Midwest (Chicago) us-phoenix-1(inter-région à us-chicago-1)

Pour extraire les informations clés de la mémoire à long terme

chapeau

Lorsque vous créez un projet, vous pouvez activer l'extraction d'informations à partir des conversations et des réponses pour une fonction de mémoire à long terme. Vous sélectionnez un modèle d'extraction qui vise à extraire les informations clés des conversations. Voir le tableau suivant pour les régions et le modèle pris en charge pour l'extraction des informations clés à utiliser pour la mémoire à long terme.

Région Modèle d'extraction disponible
Régions commerciales disponibles (OC1) faisant référence aux régions pour lesquelles OpenAI gpt-oss-120b est disponible OpenAI gpt-oss-120b
Pour stocker les informations clés en tant qu'intégrations pour la mémoire à long terme

Lorsque vous créez un projet, vous pouvez sélectionner un modèle d'intégration pour stocker les mémoires extraites en tant que vecteurs interrogeables. Le modèle d'intégration disponible dépend de la région du projet. Voir le tableau suivant pour le modèle d'intégration disponible dans chaque région :

Région Code de la région Modèle intégré disponible
Brésil - Est (Sao Paulo) sa-saopaulo-1 Cohere Embed Multilingue 3 (Obsolète)
Allemagne - Centre (Francfort) eu-frankfurt-1 Cohere Embed Multilingue 3 (Obsolète)
Royaume-Uni - Sud (Londres) uk-london-1 Cohere Embed Multilingue 3 (Obsolète)
Inde - Sud (Hyderabad) ap-hyderabad-1 Cohere a intégré l'image multilingue 3 (obsolète)
Est des États-Unis (Ashburn) (cross region to États-Unis Midwest (Chicago) us-ahsburn-1 Cohere Embed 4
Japon - Centre (Osaka) ap-osaka-1 Cohere Embed 4
Centre de l'Arabie saoudite (Riyad) me-riyadh-1 Cohere Embed 4
États-Unis - Midwest (Chicago) us-chicago-1 Cohere Embed 4
Ouest des États-Unis (Phoenix) (cross region to États-Unis Midwest (Chicago) us-phoenix-1 Cohere Embed 4

Appels externes

Appels externes aux modèles Grok xAI

Important

Appels externes aux modèles Grok xAI

Les modèles Grok xAI sont hébergés dans un centre de données OCI, dans une location provisionnée pour xAI. Les modèles Grok xAI, accessibles au moyen du service d'intelligence artificielle générative pour OCI, sont gérés par xAI.

Appels externes aux modèles Google

Important

Appels externes à Google Gemini 2.5 Pro pour les régions des États-Unis

Le modèle Google Gemini 2.5 Pro accessible au moyen du service d'intelligence artificielle générative pour OCI dans les régions des États-Unis est hébergé à l'externe par Google. Par conséquent, un appel à un modèle Google Gemini 2.5 Pro (au moyen du service d'intelligence artificielle générative pour OCI) entraîne un appel à un emplacement Google. Pour Google Gemini 2.5 Pro, un emplacement régional Google Americas est utilisé, qui achemine la demande uniquement vers un emplacement Google Americas. Le traitement de l'apprentissage automatique a lieu dans un emplacement Google Americas.

Important

Appels externes à Gemini 2.5 Flash pour les régions des États-Unis

Le modèle Gemini 2.5 Flash accessible au moyen du service d'intelligence artificielle générative pour OCI dans les régions des États-Unis est hébergé à l'externe par Google. Par conséquent, un appel à un modèle Gemini 2.5 Flash (au moyen du service d'intelligence artificielle générative pour OCI) entraîne un appel à un emplacement Google. Pour Gemini 2.5 Flash, un emplacement régional Google Americas est utilisé, qui achemine la demande uniquement vers un emplacement Google Americas. Le traitement de l'apprentissage automatique a lieu dans un emplacement Google Americas.

Important

Appels externes à Gemini 2.5 Flash-Lite pour les régions des États-Unis

Le modèle Gemini 2.5 Flash-Lite accessible au moyen du service d'intelligence artificielle générative pour OCI dans les régions des États-Unis est hébergé à l'externe par Google. Par conséquent, un appel à un modèle Gemini 2.5 Flash-Lite (au moyen du service d'intelligence artificielle générative pour OCI) entraîne un appel à un emplacement Google. Pour Gemini 2.5 Flash-Lite, un emplacement régional Google Americas est utilisé, qui achemine la demande uniquement vers un emplacement Google Americas. Le traitement de l'apprentissage automatique a lieu dans un emplacement Google Americas.