Modèles et régions d'IA générative pour les agents d'IA d'entreprise
Les agents d'IA d'entreprise du service d'intelligence artificielle générative pour OCI prennent en charge un sous-ensemble de modèles et de régions prétraités du service d'IA générative pour OCI. Cette page répertorie les modèles et les régions pris en charge pour l'inférence agéntique d'exécution et la mémoire de projet.
Pour appeler des modèles
Les modèles suivants sont pris en charge pour les points d'extrémité compatibles avec OCI OpenAI et les outils compatibles avec OpenAI.
Modèles de clavardage disponibles
Les agents peuvent appeler les modèles de clavardage suivants pour les cas d'utilisation d'inférence agéntique :
- Plateforme d'intelligence artificielle de Google Vertex
- Source ouverte OpenAI
- Plateforme xAI
Appels externes aux modèles Grok xAI
Les modèles Grok xAI sont hébergés dans un centre de données OCI, dans une location provisionnée pour xAI. Les modèles Grok xAI, accessibles au moyen du service d'intelligence artificielle générative pour OCI, sont gérés par xAI.
Régions commerciales disponibles (OC1)
Vous pouvez accéder aux modèles d'inférence agéntique dans une ou plusieurs des régions OC1 suivantes :
| Nom de la région | Emplacement | Identificateur de la région | Clé de région |
|---|---|---|---|
| Brésil - Est (Sao Paulo) | São Paulo |
sa-saopaulo-1
|
GRU
|
| Allemagne - Centre (Francfort) | Francfort |
eu-frankfurt-1
|
FRA
|
| Inde - Sud (Hyderabad) | Hyderabad |
ap-hyderabad-1
|
HYD
|
| Japon - Centre (Osaka) | Osaka |
ap-osaka-1
|
KIX
|
| Centre de l'Arabie saoudite (Riyad) | Riyad |
me-riyadh-1
|
RUH
|
| Royaume-Uni - Sud (Londres) | Londres |
uk-london-1
|
LHR
|
| États-Unis - Est (Ashburn) | Ashburn |
us-ashburn-1
|
IAD
|
| États-Unis - Midwest (Chicago) | Chicago |
us-chicago-1
|
ORD
|
| États-Unis - Ouest (Phoenix) | Phoenix |
us-phoenix-1
|
PHX
|
Découvrez À propos des régions et des domaines de disponibilité.
- Émirats arabes unis - Est (Dubaï) : Les points d'extrémité et les outils compatibles avec OCI-OpenAI ne sont pas disponibles dans cette région.
- Disponibilité : Tous les modèles répertoriés ne sont pas disponibles dans les régions listées précédentes. Pour les régions prises en charge par modèle et les détails du déploiement, voir la page Modèles par région.
- Appels externes : Pour des notes sur les modèles avec appels externes, voir Appels externes.
Les modèles suivants sont pris en charge pour les outils compatibles avec xAI utilisés avec l'API de réponses OCI.
Modèles xAI pris en charge
Régions prises en charge
Vous pouvez accéder aux modèles xAI en appelant les points d'extrémité dans les régions OC1 suivantes :
| Nom de la région | Emplacement | Identificateur de la région | Clé de région |
|---|---|---|---|
| États-Unis - Est (Ashburn) | Ashburn |
us-ashburn-1
|
IAD
|
| États-Unis - Midwest (Chicago) | Chicago |
us-chicago-1
|
ORD
|
| États-Unis - Ouest (Phoenix) | Phoenix |
us-phoenix-1
|
PHX
|
Appels externes aux modèles Grok xAI
Les modèles Grok xAI sont hébergés dans un centre de données OCI, dans une location provisionnée pour xAI. Les modèles Grok xAI, accessibles au moyen du service d'intelligence artificielle générative pour OCI, sont gérés par xAI.
Pour activer la mémoire du projet
Lorsque vous créez un projet, vous pouvez activer le compactage de mémoire à court terme pour les conversations et les réponses liées à ce projet. Voir le tableau suivant pour les modèles et régions disponibles pour le compactage de la mémoire.
| Région | Code de la région | Modèle de mémoire à court terme |
|---|---|---|
| Brésil - Est (Sao Paulo) | sa-saopaulo-1 |
|
| Allemagne - Centre (Francfort) | eu-frankfurt-1 |
|
| Royaume-Uni - Sud (Londres) | uk-london-1 |
|
| Inde - Sud (Hyderabad) | ap-hyderabad-1 |
|
| Est des États-Unis (Ashburn) (cross region to États-Unis Midwest (Chicago) | us-ahsburn-1 (entre les régions et us-chicago-1) |
|
| Japon - Centre (Osaka) | ap-osaka-1 |
|
| Centre de l'Arabie saoudite (Riyad) | me-riyadh-1 |
|
| États-Unis - Midwest (Chicago) | us-chicago-1 |
|
| Ouest des États-Unis (Phoenix) (cross region to États-Unis Midwest (Chicago) | us-phoenix-1(inter-région à us-chicago-1) |
Pour extraire les informations clés de la mémoire à long terme
chapeau
Lorsque vous créez un projet, vous pouvez activer l'extraction d'informations à partir des conversations et des réponses pour une fonction de mémoire à long terme. Vous sélectionnez un modèle d'extraction qui vise à extraire les informations clés des conversations. Voir le tableau suivant pour les régions et le modèle pris en charge pour l'extraction des informations clés à utiliser pour la mémoire à long terme.
| Région | Modèle d'extraction disponible |
|---|---|
| Régions commerciales disponibles (OC1) faisant référence aux régions pour lesquelles OpenAI gpt-oss-120b est disponible | OpenAI gpt-oss-120b |
Lorsque vous créez un projet, vous pouvez sélectionner un modèle d'intégration pour stocker les mémoires extraites en tant que vecteurs interrogeables. Le modèle d'intégration disponible dépend de la région du projet. Voir le tableau suivant pour le modèle d'intégration disponible dans chaque région :
| Région | Code de la région | Modèle intégré disponible |
|---|---|---|
| Brésil - Est (Sao Paulo) | sa-saopaulo-1 |
Cohere Embed Multilingue 3 (Obsolète) |
| Allemagne - Centre (Francfort) | eu-frankfurt-1 |
Cohere Embed Multilingue 3 (Obsolète) |
| Royaume-Uni - Sud (Londres) | uk-london-1 |
Cohere Embed Multilingue 3 (Obsolète) |
| Inde - Sud (Hyderabad) | ap-hyderabad-1 |
Cohere a intégré l'image multilingue 3 (obsolète) |
| Est des États-Unis (Ashburn) (cross region to États-Unis Midwest (Chicago) | us-ahsburn-1 |
Cohere Embed 4 |
| Japon - Centre (Osaka) | ap-osaka-1 |
Cohere Embed 4 |
| Centre de l'Arabie saoudite (Riyad) | me-riyadh-1 |
Cohere Embed 4 |
| États-Unis - Midwest (Chicago) | us-chicago-1 |
Cohere Embed 4 |
| Ouest des États-Unis (Phoenix) (cross region to États-Unis Midwest (Chicago) | us-phoenix-1
|
Cohere Embed 4 |
Appels externes
Appels externes aux modèles Grok xAI
Appels externes aux modèles Grok xAI
Les modèles Grok xAI sont hébergés dans un centre de données OCI, dans une location provisionnée pour xAI. Les modèles Grok xAI, accessibles au moyen du service d'intelligence artificielle générative pour OCI, sont gérés par xAI.
Appels externes aux modèles Google
Appels externes à Google Gemini 2.5 Pro pour les régions des États-Unis
Le modèle Google Gemini 2.5 Pro accessible au moyen du service d'intelligence artificielle générative pour OCI dans les régions des États-Unis est hébergé à l'externe par Google. Par conséquent, un appel à un modèle Google Gemini 2.5 Pro (au moyen du service d'intelligence artificielle générative pour OCI) entraîne un appel à un emplacement Google. Pour Google Gemini 2.5 Pro, un emplacement régional Google Americas est utilisé, qui achemine la demande uniquement vers un emplacement Google Americas. Le traitement de l'apprentissage automatique a lieu dans un emplacement Google Americas.
Appels externes à Gemini 2.5 Flash pour les régions des États-Unis
Le modèle Gemini 2.5 Flash accessible au moyen du service d'intelligence artificielle générative pour OCI dans les régions des États-Unis est hébergé à l'externe par Google. Par conséquent, un appel à un modèle Gemini 2.5 Flash (au moyen du service d'intelligence artificielle générative pour OCI) entraîne un appel à un emplacement Google. Pour Gemini 2.5 Flash, un emplacement régional Google Americas est utilisé, qui achemine la demande uniquement vers un emplacement Google Americas. Le traitement de l'apprentissage automatique a lieu dans un emplacement Google Americas.
Appels externes à Gemini 2.5 Flash-Lite pour les régions des États-Unis
Le modèle Gemini 2.5 Flash-Lite accessible au moyen du service d'intelligence artificielle générative pour OCI dans les régions des États-Unis est hébergé à l'externe par Google. Par conséquent, un appel à un modèle Gemini 2.5 Flash-Lite (au moyen du service d'intelligence artificielle générative pour OCI) entraîne un appel à un emplacement Google. Pour Gemini 2.5 Flash-Lite, un emplacement régional Google Americas est utilisé, qui achemine la demande uniquement vers un emplacement Google Americas. Le traitement de l'apprentissage automatique a lieu dans un emplacement Google Americas.