Présentation du déploiement d'agents dans OCI Generative AI

Vous pouvez déployer des agents à l'aide des applications OCI Generative AI, qui fournissent une exécution gérée pour les charges globales d'agent en conteneur.

Pour déployer un agent, packagez-le en tant qu'image de conteneur, téléchargez-le vers Oracle Cloud Infrastructure Registry (OCIR) et déployez-le à l'aide de la console, de l'API ou de l'interface de ligne de commande OCI.

Au cours du déploiement, configurez :

  • Redimensionnement
  • Stockage
  • Mise en réseau
  • Authentification

Après le déploiement, le service provisionne une adresse (par exemple, une URL HTTP) que les clients ou d'autres agents peuvent utiliser pour appeler l'agent.

Fonctionnement

Après avoir développé un agent localement (par exemple, en utilisant LangGraph ou des structures similaires), vous créez une application d'IA générative pour définir la configuration d'exécution.

Vous créez ensuite un déploiement en sélectionnant une image de conteneur. Le déploiement actif traite les demandes via l'adresse d'application. Une fois le déploiement provisionné, l'adresse devient disponible pour l'appel de l'agent.

Visite virtuelle

Utilisez les applications d'IA générative pour déployer des agents en tant qu'applications en conteneur gérées dans OCI Generative AI.

Avec les applications d'IA générative, vous créez une image de conteneur, la téléchargez vers Oracle Cloud Infrastructure Registry (OCIR) et déployez cette image en tant qu'application d'IA générative à l'aide de la console, de l'API ou de l'interface de ligne de commande OCI.

Lorsque vous déployez un agent, vous pouvez configurer le mode d'exécution de l'application et la manière dont les clients y accèdent, notamment :

  • Redimensionnement
  • Stockage
  • Mise en réseau
  • Authentification

Une fois le déploiement provisionné, OCI Generative AI fournit une adresse, telle qu'une URL HTTP, que les clients peuvent utiliser pour appeler l'agent déployé.

Le déploiement d'un agent est utile lorsque vous voulez une exécution gérée pour une application d'agent en conteneur, avec une configuration de déploiement gérée par OCI et un provisionnement d'adresse.

Pour plus d'informations, reportez-vous aux rubriques sur les applications d'IA générative et le déploiement d'applications d'agent en conteneur.