Visión general del despliegue de agentes en OCI Generative AI
Puede desplegar agentes mediante OCI Generative AI Applications, que proporcionan un tiempo de ejecución gestionado para cargas de trabajo de agentes en contenedores.
Para desplegar un agente, empaquetarlo como una imagen de contenedor, cargarlo en Oracle Cloud Infrastructure Registry (OCIR) y desplegarlo mediante la consola, la API o la CLI de OCI.
Durante el despliegue, configure:
- Escalado
- Almacenamiento
- Redes
- Autenticación
Después del despliegue, el servicio aprovisiona un punto final (por ejemplo, una URL HTTP) que los clientes u otros agentes pueden utilizar para llamar al agente.
Cómo Funciona
Después de desarrollar un agente localmente (por ejemplo, mediante LangGraph o marcos similares), cree una aplicación de IA generativa para definir la configuración de tiempo de ejecución.
A continuación, puede crear un despliegue seleccionando una imagen de contenedor. El despliegue activo sirve solicitudes a través del punto final de la aplicación. Una vez aprovisionado el despliegue, el punto final pasa a estar disponible para llamar al agente.
Tutorial
Utiliza aplicaciones de IA generativa para desplegar agentes como aplicaciones en contenedores gestionadas en OCI Generative AI.
Con las aplicaciones de IA generativa, puedes crear una imagen de contenedor, cargarla en Oracle Cloud Infrastructure Registry (OCIR) y desplegar esa imagen como una aplicación de IA generativa mediante la consola, la API o la CLI de OCI.
Al desplegar un agente, puede configurar cómo se ejecuta la aplicación y cómo acceden los clientes a ella, incluidos:
- Escalado
- Almacenamiento
- Redes
- Autenticación
Una vez aprovisionado el despliegue, OCI Generative AI proporciona un punto final, como una URL HTTP, que los clientes pueden utilizar para llamar al agente desplegado.
El despliegue de un agente es útil cuando desea un tiempo de ejecución gestionado para una aplicación de agente en contenedores, con configuración de despliegue y aprovisionamiento de punto final gestionados por OCI.
Para obtener más información, consulte los temas sobre las aplicaciones de IA generativa y el despliegue de aplicaciones de agente en contenedores.