Agentes de IA empresarial en OCI Generative AI

OCI Generative AI proporciona dos enfoques principales para crear agentes empresariales, y también puede combinarlos en una arquitectura híbrida.

Los dos enfoques son:

Creación de agentes con API de respuestas de OCI
Despliega aplicaciones ágiles alojadas en OCI Generative AI

Estas opciones le permiten empezar con un enfoque sencillo que prioriza la API, pasar a despliegues alojados cuando los necesite o combinar ambos en la misma arquitectura.

Enfoque 1: Creación de agentes con la API de respuestas de OCI

Utilice la API de OCI Responses cuando desee una forma flexible y centrada en la API de crear agentes sin gestionar la infraestructura usted mismo.

La API de respuestas de OCI es la API principal para flujos de trabajo ágentic en OCI Generative AI. Es compatible con OpenAI, lo que significa que utiliza la misma sintaxis de solicitud y patrones de solicitud que la API de respuestas de OpenAI. Sin embargo, la URL base apunta a OCI Generative AI, la autenticación utiliza credenciales de OCI Generative AI y las solicitudes se procesan a través de OCI Generative AI en regiones de OCI.

Este enfoque es útil cuando desea crear agentes rápidamente mientras mantiene la ejecución del modelo, el uso de herramientas y los servicios de soporte gestionados por OCI.

Qué soporta la API de respuestas

Con la API de respuestas de OCI, puede:

Seleccione entre los modelos ofrecidos por OCI soportados en las regiones de OCI soportadas.
Utiliza un formato de API compatible con OpenAI con autenticación de OCI y ejecución gestionada por OCI.
Cree flujos de trabajo de agente de un solo paso o de varios pasos.
Agregue contexto de conversación para interacciones de varias vueltas.
Utilice las herramientas soportadas de la API de respuestas, como la búsqueda de archivos, el intérprete de código, las llamadas de función y las llamadas MCP.
Integre la API básica, como archivos, almacenes vectoriales y contenedores, en el mismo flujo de trabajo.

Conversaciones y memoria

La API de respuestas funciona con la API de conversaciones para que pueda mantener el contexto en las distintas giras en una conversación con varios giros.

OCI Generative AI también proporciona un recurso denominado proyectos. Un proyecto agrupa recursos de agente relacionados, como respuestas, conversaciones, archivos, contenedores y configuración de memoria.

En un proyecto, puede configurar el comportamiento de la memoria, que incluye:

Memoria a largo plazo para contexto persistente en interacciones relacionadas en el mismo proyecto
Memoria a corto plazo para el contexto llevado a cabo en una conversación en curso

Esto le permite organizar los flujos de trabajo de agentes relacionados y gestionar el contexto retenido de forma controlada.

Herramientas con la API Responses

El soporte de herramientas forma parte de la API Responses. Cuando envía una solicitud de API de respuestas, puede incluir definiciones de herramientas soportadas directamente en la solicitud.

OCI Generative AI soporta las siguientes herramientas de API de respuestas:

Búsqueda de Archivo
Intérprete de código
Llamada de función
Llamadas de MCP

Estas herramientas amplían lo que el modelo puede hacer durante un flujo de trabajo. A medida que OCI Generative AI amplía el soporte para más herramientas de API de respuestas, este conjunto puede crecer.

API básica con la API de respuestas

Si un flujo de trabajo necesita bloques de creación de nivel inferior, puede utilizar la API básica junto con la API de respuestas.

Estas API fundamentales incluyen:

Archivos
Almacenes de vectores
Contenedores

Estas API también son compatibles con OpenAI y funcionan sin problemas con la API de respuestas. Puede utilizarlos para admitir la recuperación, el manejo de documentos, la ejecución en sandbox y otras necesidades de flujo de trabajo del agente.

Búsqueda SQL (NL2SQL)

OCI Generative AI también proporciona SQL Search (NL2SQL) para flujos de trabajo de agente de IA empresarial. NL2SQL convierte las solicitudes en lenguaje natural en SQL validado para datos empresariales federados sin mover ni copiar los datos subyacentes. Los datos de origen se deben almacenar en Oracle Autonomous AI Database. NL2SQL utiliza una capa de enriquecimiento semántico para asignar términos de negocio a tablas, columnas y uniones de base de datos.

NL2SQL solo genera SQL y no ejecuta la consulta. Para utilizarlo, cree un almacén semántico respaldado por un almacén de vectores de datos estructurados, configure las conexiones necesarias, ejecute el enriquecimiento y, a continuación, llame a la API GenerateSqlFromNl. La ejecución de consultas se maneja por separado mediante el servidor MCP de DBTools, que autoriza y ejecuta la consulta en la base de datos de origen mediante permisos y guías de protección existentes.

Por qué utilizar este enfoque

Utilice el enfoque de la API Responses cuando desee:

Un inicio rápido para crear agentes
Ejecución gestionada por OCI sin gestionar la infraestructura
Sintaxis de solicitud compatible con OpenAI
Soporte flexible para modelos, conversaciones, herramientas y API fundamentales
Una arquitectura con API como elemento principal que puede crecer con su aplicación
Acceso a otras capacidades de agente de OCI como NL2SQL para flujos de trabajo de datos empresariales

En resumen, este enfoque te ofrece una forma rápida y flexible de crear agentes, mientras que OCI Generative AI gestiona el entorno de ejecución subyacente.

Enfoque 2: Despliegue de aplicaciones Agentic alojadas

Utiliza aplicaciones alojadas cuando desees empaquetar y desplegar tu propio tiempo de ejecución de agente en OCI Generative AI.

En este enfoque, OCI Generative AI proporciona un modelo de alojamiento gestionado basado en dos recursos:

Aplicaciones
Despliegues

Una aplicación define la configuración de la aplicación alojada. Un despliegue ejecuta una imagen de contenedor específica para esa aplicación.

Este enfoque es útil cuando ya tiene una aplicación auténtica que desea empaquetar, desplegar y ejecutar en una infraestructura gestionada por OCI.

Lo que se configura en una aplicación

Al crear una aplicación, se define la configuración de alojamiento principal para la aplicación agentic.

Esto incluye configuraciones como:

Comportamiento de escala de despliegue para gestionar la carga
Si la aplicación utiliza almacenamiento gestionado
El servicio de almacenamiento gestionado que utiliza la aplicación:
- PostgreSQL OCI
- Caché de OCI
- Oracle Autonomous Database
VCN y subred para la aplicación
Si la aplicación utiliza puntos finales públicos o privados
Configuración del dominio de identidad de OCI IAM para la aplicación

Integración de aplicaciones de OCI IAM

Como parte del modelo de aplicación alojado, asigne una aplicación en un dominio de identidad de OCI.

Esta aplicación de dominio de identidad de OCI es una aplicación personalizada registrada en Oracle Cloud Infrastructure Identity and Access Management (OCI IAM). Controla el acceso de los usuarios y soporta la integración segura, la conexión única (SSO) y la propagación de identidades mediante protocolos OAuth.

Cómo funcionan los despliegues

Después de crear la aplicación, cree un despliegue dentro de esa aplicación.

Un despliegue utiliza la configuración definida por la aplicación y apunta a una imagen de contenedor específica que ha creado y transferido a OCI Container Registry.

El flujo típico es:

Cree la imagen de contenedor
Transfiera la imagen a OCI Container Registry
Crear una aplicación en OCI Generative AI
Crear un despliegue en esa aplicación
Señalar el despliegue a la imagen del contenedor
Ejecutar el despliegue y activarlo

El despliegue activo sirve solicitudes a través del punto final de la aplicación.

Por qué utilizar este enfoque

Utilice las aplicaciones alojadas cuando desee:

Para ejecutar su propio tiempo de ejecución de agente empaquetado en OCI
Infraestructura gestionada por OCI para alojamiento y escalado
Integración de identidad, almacenamiento y redes gestionadas
Un modelo de despliegue basado en imágenes de contenedor y OCI Container Registry
Una opción de alojamiento de producción para aplicaciones agentic

Este enfoque está diseñado para alojar aplicaciones ágiles en una infraestructura gestionada por OCI con soporte integrado para el despliegue y la escala automática.

Enfoque híbrido

Dado que ambos enfoques están disponibles, también puede utilizar un enfoque híbrido.

En una arquitectura híbrida, utiliza la API de respuestas para la orquestación de modelos, conversaciones, herramientas, API fundamentales y capacidades de soporte como NL2SQL, al tiempo que utiliza despliegues alojados para entornos de ejecución de agentes personalizados que empaqueta y opera en OCI.

Por ejemplo, podría:

Llamada a la API de respuestas de OCI para interacción de modelos y uso de herramientas
Utilizar la API de conversaciones y la memoria basada en proyectos para el manejo de contextos
Uso de archivos, almacenes vectoriales y contenedores como parte del flujo de trabajo
Uso de NL2SQL para la generación de lenguaje natural a SQL con datos empresariales federados
Desplegar un tiempo de ejecución de agente personalizado como una aplicación alojada

Esto le permite combinar capacidades de agente gestionado por OCI con componentes de aplicación empaquetados que desea ejecutar en OCI.

Decida qué enfoque se ajusta a su caso de uso

Utiliza el enfoque de API de respuestas cuando desees la forma más rápida y flexible de crear agentes con la ejecución de modelos gestionados por OCI, conversaciones, herramientas, API fundamentales y capacidades de soporte como NL2SQL.

Utilice aplicaciones alojadas cuando desee empaquetar y desplegar su propio tiempo de ejecución de agente y ejecutarlo en una infraestructura gestionada por OCI.

Utiliza un enfoque híbrido cuando tu arquitectura se beneficie de ambos modelos.

Diagrama

El diagrama muestra cómo encajan estas piezas. Por un lado está la aplicación de cliente o agente, que incluye SDK, marcos, peticiones de datos, configuración de modelo y herramientas locales. En el medio están la API y los recursos de OCI gestionados, incluida la API de respuestas de OCI, la memoria, los archivos, las tiendas vectoriales, los contenedores y las capacidades de herramientas relacionadas. Por otro lado, está la infraestructura y el tiempo de ejecución gestionados por OCI que se utiliza para ejecutar modelos, herramientas y cargas de trabajo alojadas, al tiempo que se integra con los servicios de OCI y los sistemas de terceros.

Documentación de Oracle Cloud Infrastructure

Agentes de IA empresarial en OCI Generative AI

Enfoque 1: Creación de agentes con la API de respuestas de OCI

Qué soporta la API de respuestas

Conversaciones y memoria

Herramientas con la API Responses

API básica con la API de respuestas

Búsqueda SQL (NL2SQL)

Por qué utilizar este enfoque

Enfoque 2: Despliegue de aplicaciones Agentic alojadas

Lo que se configura en una aplicación

Integración de aplicaciones de OCI IAM

Cómo funcionan los despliegues

Por qué utilizar este enfoque

Enfoque híbrido

Decida qué enfoque se ajusta a su caso de uso

Diagrama

Temas relacionados