Aperçu du déploiement d'agents dans le service d'intelligence artificielle générative pour OCI
Vous pouvez déployer des agents à l'aide des applications d'intelligence artificielle générative pour OCI, qui fournissent une exécution gérée pour les charges de travail d'agent conteneurisées.
Pour déployer un agent, assemblez-le en tant qu'image de conteneur, chargez-le dans Oracle Cloud Infrastructure Registry (OCIR) et déployez-le à l'aide de la console, de l'API ou de l'interface de ligne de commande OCI.
Lors du déploiement, configurez :
- Ajustement
- Stockage
- Réseau
- Authentication
Après le déploiement, le service provisionne un point d'extrémité (par exemple, une URL HTTP) que les clients ou d'autres agents peuvent utiliser pour appeler l'agent.
Fonctionnement
Après avoir développé un agent localement (par exemple, à l'aide de LangGraph ou de cadres similaires), vous créez une application d'IA générative pour définir la configuration d'exécution.
Vous créez ensuite un déploiement en sélectionnant une image de conteneur. Le déploiement actif envoie des demandes au moyen du point d'extrémité de l'application. Une fois le déploiement provisionné, le point d'extrémité devient disponible pour l'appel de l'agent.
Procédure pas à pas
Utilisez des applications d'IA générative pour déployer des agents en tant qu'applications conteneurisées gérées dans l'IA générative OCI.
Avec les applications d'IA générative, vous créez une image de conteneur, la chargez dans Oracle Cloud Infrastructure Registry (OCIR) et déployez cette image en tant qu'application d'IA générative à l'aide de la console, de l'API ou de l'interface de ligne de commande OCI.
Lorsque vous déployez un agent, vous pouvez configurer le mode d'exécution de l'application et la façon dont les clients y accèdent, notamment :
- Ajustement
- Stockage
- Réseau
- Authentification
Une fois le déploiement provisionné, OCI Generative AI fournit un point d'extrémité, tel qu'une URL HTTP, que les clients peuvent utiliser pour appeler l'agent déployé.
Le déploiement d'un agent est utile lorsque vous voulez une exécution gérée pour une application d'agent conteneurisée, avec configuration de déploiement gérée par OCI et provisionnement de point d'extrémité.
Pour plus d'informations, voir les rubriques sur les applications d'IA générative et le déploiement d'applications d'agent conteneurisées.