Agents d'IA d'entreprise dans OCI Generative AI
OCI Generative AI fournit deux approches principales pour la création d'agents de niveau entreprise, et vous pouvez également les combiner dans une architecture hybride.
Les deux approches sont les suivantes :
- Créer des agents avec l'API OCI Réponses
- Déployer des applications agentiques hébergées dans OCI Generative AI
Ces options vous permettent de commencer par une approche API-first simple, de passer à des déploiements hébergés lorsque vous en avez besoin ou de combiner les deux dans la même architecture.
Approche 1 : création d'agents avec l'API OCI Responses
Utilisez l'API OCI Responses pour créer des agents de manière flexible et axée sur les API sans gérer vous-même l'infrastructure.
L'API OCI Responses est l'API principale pour les workflows agénétiques dans OCI Generative AI. Il est compatible avec OpenAI, ce qui signifie que vous utilisez la même syntaxe de demande et les mêmes modèles de demande que l'API de réponses OpenAI. Cependant, l'URL de base pointe vers OCI Generative AI, l'authentification utilise les informations d'identification OCI Generative AI et les demandes sont traitées via OCI Generative AI dans les régions OCI.
Cette approche est utile lorsque vous souhaitez créer des agents rapidement tout en conservant l'exécution du modèle, l'utilisation des outils et les services de support gérés par OCI.
Prise en charge par l'API des réponses
Avec l'API OCI Responses, vous pouvez :
- Sélectionnez parmi les modèles proposés par OCI pris en charge dans les régions OCI prises en charge.
- Utilisez un format d'API compatible OpenAI avec l'authentification OCI et l'exécution gérée par OCI.
- Créez des workflows d'agent en une ou plusieurs étapes.
- Ajoutez un contexte de conversation pour les interactions multi-tours.
- Utilisez les outils pris en charge par l'API Réponses, tels que la recherche de fichier, l'interpréteur de code, l'appel de fonction et l'appel MCP.
- Intégrez les API de base telles que les fichiers, les magasins de vecteurs et les conteneurs dans le même workflow.
Conversations et mémoire
L'API des réponses fonctionne avec l'API des conversations afin que vous puissiez conserver le contexte sur plusieurs tours dans une conversation à plusieurs tours.
OCI Generative AI fournit également une ressource appelée projects. Un projet regroupe les ressources d'agent associées, telles que les réponses, les conversations, les fichiers, les conteneurs et les paramètres de mémoire.
Dans un projet, vous pouvez configurer le comportement de la mémoire, notamment :
- Mémoire à long terme pour un contexte persistant entre les interactions associées dans le même projet
- Mémoire à court terme pour le contexte reporté dans une conversation en cours
Cela vous permet d'organiser les workflows d'agent associés et de gérer le contexte conservé de manière contrôlée.
Outils avec l'API Réponses
La prise en charge des outils fait partie de l'API Réponses. Lorsque vous envoyez une demande d'API de réponses, vous pouvez inclure les définitions d'outil prises en charge directement dans la demande.
OCI Generative AI prend en charge les outils d'API de réponses suivants :
- Recherche de fichier
- Interpréteur de code
- Appel de fonction
- Appel MCP
Ces outils étendent ce que le modèle peut faire au cours d'un workflow. Alors qu'OCI Generative AI étend la prise en charge d'un plus grand nombre d'outils d'API Responses, cet ensemble peut évoluer.
API de base avec l'API de réponses
Si un workflow a besoin de blocs de construction de niveau inférieur, vous pouvez utiliser l'API de base avec l'API Réponses.
Ces API de base sont les suivantes :
- Fichiers
- Magasins de vecteurs
- Conteneurs
Ces API sont également compatibles avec l'IA ouverte et fonctionnent de manière transparente avec l'API Réponses. Vous pouvez les utiliser pour prendre en charge l'extraction, la gestion des documents, l'exécution en modèle d'environnement restreint et d'autres besoins de workflow d'agent.
Recherche SQL (NL2SQL)
OCI Generative AI fournit également une recherche SQL (NL2SQL) pour les workflows de l'agent d'IA d'entreprise. NL2SQL convertit les demandes en langage naturel en SQL validé pour les données d'entreprise fédérées sans déplacer ni copier les données sous-jacentes. Les données source doivent être stockées dans Oracle Autonomous Database. NL2SQL utilise une couche d'enrichissement sémantique pour mettre en correspondance des termes métier avec des tables de base de données, des colonnes et des jointures.
NL2SQL génère uniquement du code SQL et n'exécute pas la requête. Pour l'utiliser, vous créez une banque sémantique soutenue par une banque de vecteurs de données structurées, configurez les connexions requises, exécutez l'enrichissement, puis appelez l'API GenerateSqlFromNl. L'exécution des requêtes est gérée séparément via le serveur DBTools MCP, qui autorise et exécute la requête sur la base de données source à l'aide des droits d'accès et des garde-fous existants.
Pourquoi utiliser cette approche
Utilisez l'approche API Réponses lorsque vous voulez :
- Un démarrage rapide pour les agents de bâtiment
- Exécution gérée par OCI sans gestion d'infrastructure
- Syntaxe de requête compatible OpenAI
- Prise en charge flexible des modèles, conversations, outils et API de base
- Une architecture axée sur les API qui peut évoluer avec votre application
- Accès à d'autres fonctionnalités d'agent OCI telles que NL2SQL pour les workflows de données d'entreprise
En bref, cette approche vous offre un moyen rapide et flexible de créer des agents tandis qu'OCI Generative AI gère l'environnement d'exécution sous-jacent.
Approche 2 : Déployer des applications agentiques hébergées
Utilisez des applications hébergées lorsque vous souhaitez packager et déployer votre propre exécution d'agent dans OCI Generative AI.
Dans cette approche, OCI Generative AI fournit un modèle d'hébergement géré basé sur deux ressources :
- Applications
- Déploiements
Une application définit la configuration de l'application hébergée. Un déploiement exécute une image de conteneur spécifique pour cette application.
Cette approche est utile lorsque vous disposez déjà d'une application agentic que vous souhaitez packager, déployer et exécuter sur une infrastructure gérée par OCI.
Ce que vous configurez dans une application
Lorsque vous créez une application, vous définissez la configuration d'hébergement de base pour l'application agentic.
Cela inclut des paramètres tels que :
- Comportement de redimensionnement du déploiement pour gérer la charge
- Indique si l'application utilise le stockage géré
- Service de stockage géré utilisé par l'application :
- OCI PostgreSQL
- Cache OCI
- Oracle Autonomous Database
- Le VCN et le sous-réseau de l'application
- Indique si l'application utilise des adresses publiques ou privées
- Configuration du domaine d'identité OCI IAM pour l'application
Intégration d'applications OCI IAM
Dans le cadre du modèle d'application hébergé, vous affectez une application à un domaine d'identité OCI.
Cette application de domaine d'identité OCI est une application personnalisée inscrite dans Oracle Cloud Infrastructure Identity and Access Management (OCI IAM). Il contrôle l'accès utilisateur et prend en charge l'intégration sécurisée, l'accès avec connexion unique (SSO) et la propagation des identités à l'aide des protocoles OAuth.
Fonctionnement des déploiements
Une fois l'application créée, vous créez un déploiement dans cette application.
Un déploiement utilise la configuration définie par l'application et pointe vers une image de conteneur spécifique que vous créez et propagez vers OCI Container Registry.
Le flux typique est :
- Créer une image de conteneur
- propager l'image vers OCI Container Registry,
- Créer une application dans OCI Generative AI
- créer un déploiement dans cette application ;
- Pointer le déploiement vers l'image de conteneur
- Exécuter le déploiement et le rendre actif
Le déploiement actif traite les demandes via l'adresse d'application.
Pourquoi utiliser cette approche
Utilisez des applications hébergées lorsque vous le souhaitez :
- Pour exécuter votre propre exécution d'agent packagé dans OCI
- Infrastructure gérée par OCI pour l'hébergement et le redimensionnement
- Intégration gérée du réseau, du stockage et des identités
- Un modèle de déploiement basé sur des images de conteneur et OCI Container Registry
- Une option d'hébergement de production pour les applications agénétiques
Cette approche est conçue pour héberger des applications agentiques sur une infrastructure gérée par OCI avec prise en charge intégrée du déploiement et du redimensionnement automatique.
Approche hybride
Etant donné que les deux approches sont disponibles, vous pouvez également utiliser une approche hybride.
Dans une architecture hybride, vous utilisez l'API Réponses pour l'orchestration de modèles, les conversations, les outils, les API de base et les fonctionnalités de prise en charge telles que NL2SQL, tout en utilisant des déploiements hébergés pour les exécutions d'agent personnalisé que vous packagez et utilisez dans OCI.
Par exemple, vous pouvez effectuer les opérations suivantes :
- Appeler l'API OCI Responses pour l'interaction de modèle et l'utilisation d'outils
- Utiliser l'API Conversations et la mémoire basée sur les projets pour la gestion du contexte
- Utiliser des fichiers, des magasins de vecteurs et des conteneurs dans le cadre du workflow
- Utiliser NL2SQL pour la génération de langage naturel à SQL par rapport aux données d'entreprise fédérées
- Déployer une exécution d'agent personnalisée en tant qu'application hébergée
Vous pouvez ainsi combiner les fonctionnalités d'agent géré par OCI avec les composants d'application packagés à exécuter dans OCI.
Décider quelle approche correspond à votre cas d'utilisation
Utilisez l'approche de l'API des réponses lorsque vous voulez le moyen le plus rapide et le plus flexible de créer des agents avec l'exécution de modèles gérés par OCI, les conversations, les outils, les API de base et les fonctionnalités de prise en charge telles que NL2SQL.
Utilisez des applications hébergées lorsque vous souhaitez packager et déployer votre propre exécution d'agent et l'exécuter sur une infrastructure gérée par OCI.
Utilisez une approche hybride lorsque votre architecture bénéficie des deux modèles.
Diagramme
Le diagramme montre comment ces pièces s'emboîtent. D'un côté, le client ou l'application d'agent, y compris le SDK, les structures, les invites, les paramètres de modèle et les outils locaux. Au milieu se trouvent l'API et les ressources OCI gérées, notamment l'API OCI Responses, la mémoire, les fichiers, les magasins de vecteurs, les conteneurs et les fonctionnalités d'outil associées. D'autre part, l'infrastructure et l'exécution gérées par OCI sont utilisées pour exécuter des modèles, des outils et des charges de travail hébergées, tout en s'intégrant aux services OCI et aux systèmes tiers.
