Agents d'IA d'entreprise dans OCI Generative AI

OCI Generative AI fournit deux approches principales pour la création d'agents de niveau entreprise, et vous pouvez également les combiner dans une architecture hybride.

Les deux approches sont les suivantes :

Créer des agents avec l'API OCI Réponses
Déployer des applications agentiques hébergées dans OCI Generative AI

Ces options vous permettent de commencer par une approche API-first simple, de passer à des déploiements hébergés lorsque vous en avez besoin ou de combiner les deux dans la même architecture.

Approche 1 : création d'agents avec l'API OCI Responses

Utilisez l'API OCI Responses pour créer des agents de manière flexible et axée sur les API sans gérer vous-même l'infrastructure.

L'API OCI Responses est l'API principale pour les workflows agénétiques dans OCI Generative AI. Il est compatible avec OpenAI, ce qui signifie que vous utilisez la même syntaxe de demande et les mêmes modèles de demande que l'API de réponses OpenAI. Cependant, l'URL de base pointe vers OCI Generative AI, l'authentification utilise les informations d'identification OCI Generative AI et les demandes sont traitées via OCI Generative AI dans les régions OCI.

Cette approche est utile lorsque vous souhaitez créer des agents rapidement tout en conservant l'exécution du modèle, l'utilisation des outils et les services de support gérés par OCI.

Prise en charge par l'API des réponses

Avec l'API OCI Responses, vous pouvez :

Sélectionnez parmi les modèles proposés par OCI pris en charge dans les régions OCI prises en charge.
Utilisez un format d'API compatible OpenAI avec l'authentification OCI et l'exécution gérée par OCI.
Créez des workflows d'agent en une ou plusieurs étapes.
Ajoutez un contexte de conversation pour les interactions multi-tours.
Utilisez les outils pris en charge par l'API Réponses, tels que la recherche de fichier, l'interpréteur de code, l'appel de fonction et l'appel MCP.
Intégrez les API de base telles que les fichiers, les magasins de vecteurs et les conteneurs dans le même workflow.

Conversations et mémoire

L'API des réponses fonctionne avec l'API des conversations afin que vous puissiez conserver le contexte sur plusieurs tours dans une conversation à plusieurs tours.

OCI Generative AI fournit également une ressource appelée projects. Un projet regroupe les ressources d'agent associées, telles que les réponses, les conversations, les fichiers, les conteneurs et les paramètres de mémoire.

Dans un projet, vous pouvez configurer le comportement de la mémoire, notamment :

Mémoire à long terme pour un contexte persistant entre les interactions associées dans le même projet
Mémoire à court terme pour le contexte reporté dans une conversation en cours

Cela vous permet d'organiser les workflows d'agent associés et de gérer le contexte conservé de manière contrôlée.

Outils avec l'API Réponses

La prise en charge des outils fait partie de l'API Réponses. Lorsque vous envoyez une demande d'API de réponses, vous pouvez inclure les définitions d'outil prises en charge directement dans la demande.

OCI Generative AI prend en charge les outils d'API de réponses suivants :

Recherche de fichier
Interpréteur de code
Appel de fonction
Appel MCP

Ces outils étendent ce que le modèle peut faire au cours d'un workflow. Alors qu'OCI Generative AI étend la prise en charge d'un plus grand nombre d'outils d'API Responses, cet ensemble peut évoluer.

API de base avec l'API de réponses

Si un workflow a besoin de blocs de construction de niveau inférieur, vous pouvez utiliser l'API de base avec l'API Réponses.

Ces API de base sont les suivantes :

Fichiers
Magasins de vecteurs
Conteneurs

Ces API sont également compatibles avec l'IA ouverte et fonctionnent de manière transparente avec l'API Réponses. Vous pouvez les utiliser pour prendre en charge l'extraction, la gestion des documents, l'exécution en modèle d'environnement restreint et d'autres besoins de workflow d'agent.

Recherche SQL (NL2SQL)

OCI Generative AI fournit également une recherche SQL (NL2SQL) pour les workflows de l'agent d'IA d'entreprise. NL2SQL convertit les demandes en langage naturel en SQL validé pour les données d'entreprise fédérées sans déplacer ni copier les données sous-jacentes. Les données source doivent être stockées dans Oracle Autonomous Database. NL2SQL utilise une couche d'enrichissement sémantique pour mettre en correspondance des termes métier avec des tables de base de données, des colonnes et des jointures.

NL2SQL génère uniquement du code SQL et n'exécute pas la requête. Pour l'utiliser, vous créez une banque sémantique soutenue par une banque de vecteurs de données structurées, configurez les connexions requises, exécutez l'enrichissement, puis appelez l'API GenerateSqlFromNl. L'exécution des requêtes est gérée séparément via le serveur DBTools MCP, qui autorise et exécute la requête sur la base de données source à l'aide des droits d'accès et des garde-fous existants.

Pourquoi utiliser cette approche

Utilisez l'approche API Réponses lorsque vous voulez :

Un démarrage rapide pour les agents de bâtiment
Exécution gérée par OCI sans gestion d'infrastructure
Syntaxe de requête compatible OpenAI
Prise en charge flexible des modèles, conversations, outils et API de base
Une architecture axée sur les API qui peut évoluer avec votre application
Accès à d'autres fonctionnalités d'agent OCI telles que NL2SQL pour les workflows de données d'entreprise

En bref, cette approche vous offre un moyen rapide et flexible de créer des agents tandis qu'OCI Generative AI gère l'environnement d'exécution sous-jacent.

Approche 2 : Déployer des applications agentiques hébergées

Utilisez des applications hébergées lorsque vous souhaitez packager et déployer votre propre exécution d'agent dans OCI Generative AI.

Dans cette approche, OCI Generative AI fournit un modèle d'hébergement géré basé sur deux ressources :

Applications
Déploiements

Une application définit la configuration de l'application hébergée. Un déploiement exécute une image de conteneur spécifique pour cette application.

Cette approche est utile lorsque vous disposez déjà d'une application agentic que vous souhaitez packager, déployer et exécuter sur une infrastructure gérée par OCI.

Ce que vous configurez dans une application

Lorsque vous créez une application, vous définissez la configuration d'hébergement de base pour l'application agentic.

Cela inclut des paramètres tels que :

Comportement de redimensionnement du déploiement pour gérer la charge
Indique si l'application utilise le stockage géré
Service de stockage géré utilisé par l'application :
- OCI PostgreSQL
- Cache OCI
- Oracle Autonomous Database
Le VCN et le sous-réseau de l'application
Indique si l'application utilise des adresses publiques ou privées
Configuration du domaine d'identité OCI IAM pour l'application

Intégration d'applications OCI IAM

Dans le cadre du modèle d'application hébergé, vous affectez une application à un domaine d'identité OCI.

Cette application de domaine d'identité OCI est une application personnalisée inscrite dans Oracle Cloud Infrastructure Identity and Access Management (OCI IAM). Il contrôle l'accès utilisateur et prend en charge l'intégration sécurisée, l'accès avec connexion unique (SSO) et la propagation des identités à l'aide des protocoles OAuth.

Fonctionnement des déploiements

Une fois l'application créée, vous créez un déploiement dans cette application.

Un déploiement utilise la configuration définie par l'application et pointe vers une image de conteneur spécifique que vous créez et propagez vers OCI Container Registry.

Le flux typique est :

Créer une image de conteneur
propager l'image vers OCI Container Registry,
Créer une application dans OCI Generative AI
créer un déploiement dans cette application ;
Pointer le déploiement vers l'image de conteneur
Exécuter le déploiement et le rendre actif

Le déploiement actif traite les demandes via l'adresse d'application.

Pourquoi utiliser cette approche

Utilisez des applications hébergées lorsque vous le souhaitez :

Pour exécuter votre propre exécution d'agent packagé dans OCI
Infrastructure gérée par OCI pour l'hébergement et le redimensionnement
Intégration gérée du réseau, du stockage et des identités
Un modèle de déploiement basé sur des images de conteneur et OCI Container Registry
Une option d'hébergement de production pour les applications agénétiques

Cette approche est conçue pour héberger des applications agentiques sur une infrastructure gérée par OCI avec prise en charge intégrée du déploiement et du redimensionnement automatique.

Approche hybride

Etant donné que les deux approches sont disponibles, vous pouvez également utiliser une approche hybride.

Dans une architecture hybride, vous utilisez l'API Réponses pour l'orchestration de modèles, les conversations, les outils, les API de base et les fonctionnalités de prise en charge telles que NL2SQL, tout en utilisant des déploiements hébergés pour les exécutions d'agent personnalisé que vous packagez et utilisez dans OCI.

Par exemple, vous pouvez effectuer les opérations suivantes :

Appeler l'API OCI Responses pour l'interaction de modèle et l'utilisation d'outils
Utiliser l'API Conversations et la mémoire basée sur les projets pour la gestion du contexte
Utiliser des fichiers, des magasins de vecteurs et des conteneurs dans le cadre du workflow
Utiliser NL2SQL pour la génération de langage naturel à SQL par rapport aux données d'entreprise fédérées
Déployer une exécution d'agent personnalisée en tant qu'application hébergée

Vous pouvez ainsi combiner les fonctionnalités d'agent géré par OCI avec les composants d'application packagés à exécuter dans OCI.

Décider quelle approche correspond à votre cas d'utilisation

Utilisez l'approche de l'API des réponses lorsque vous voulez le moyen le plus rapide et le plus flexible de créer des agents avec l'exécution de modèles gérés par OCI, les conversations, les outils, les API de base et les fonctionnalités de prise en charge telles que NL2SQL.

Utilisez des applications hébergées lorsque vous souhaitez packager et déployer votre propre exécution d'agent et l'exécuter sur une infrastructure gérée par OCI.

Utilisez une approche hybride lorsque votre architecture bénéficie des deux modèles.

Diagramme

Le diagramme montre comment ces pièces s'emboîtent. D'un côté, le client ou l'application d'agent, y compris le SDK, les structures, les invites, les paramètres de modèle et les outils locaux. Au milieu se trouvent l'API et les ressources OCI gérées, notamment l'API OCI Responses, la mémoire, les fichiers, les magasins de vecteurs, les conteneurs et les fonctionnalités d'outil associées. D'autre part, l'infrastructure et l'exécution gérées par OCI sont utilisées pour exécuter des modèles, des outils et des charges de travail hébergées, tout en s'intégrant aux services OCI et aux systèmes tiers.

Documentation Oracle Cloud Infrastructure

Agents d'IA d'entreprise dans OCI Generative AI

Approche 1 : création d'agents avec l'API OCI Responses

Prise en charge par l'API des réponses

Conversations et mémoire

Outils avec l'API Réponses

API de base avec l'API de réponses

Recherche SQL (NL2SQL)

Pourquoi utiliser cette approche

Approche 2 : Déployer des applications agentiques hébergées

Ce que vous configurez dans une application

Intégration d'applications OCI IAM

Fonctionnement des déploiements

Pourquoi utiliser cette approche

Approche hybride

Décider quelle approche correspond à votre cas d'utilisation

Diagramme

Rubriques connexes