Agentes de IA empresarial en OCI Generative AI

OCI Generative AI proporciona dos enfoques principales para crear agentes empresariales, y también puede combinarlos en una arquitectura híbrida.

Los dos enfoques son:

  1. Creación de agentes con API de respuestas de OCI
  2. Despliega aplicaciones ágiles alojadas en OCI Generative AI

Estas opciones le permiten empezar con un enfoque sencillo que prioriza la API, pasar a despliegues alojados cuando los necesite o combinar ambos en la misma arquitectura.

Enfoque 1: Creación de agentes con la API de respuestas de OCI

Utilice la API de OCI Responses cuando desee una forma flexible y centrada en la API de crear agentes sin gestionar la infraestructura usted mismo.

La API de respuestas de OCI es la API principal para flujos de trabajo ágentic en OCI Generative AI. Es compatible con OpenAI, lo que significa que utiliza la misma sintaxis de solicitud y patrones de solicitud que la API de respuestas de OpenAI. Sin embargo, la URL base apunta a OCI Generative AI, la autenticación utiliza credenciales de OCI Generative AI y las solicitudes se procesan a través de OCI Generative AI en regiones de OCI.

Este enfoque es útil cuando desea crear agentes rápidamente mientras mantiene la ejecución del modelo, el uso de herramientas y los servicios de soporte gestionados por OCI.

Qué soporta la API de respuestas

Con la API de respuestas de OCI, puede:

  • Seleccione entre los modelos ofrecidos por OCI soportados en las regiones de OCI soportadas.
  • Utiliza un formato de API compatible con OpenAI con autenticación de OCI y ejecución gestionada por OCI.
  • Cree flujos de trabajo de agente de un solo paso o de varios pasos.
  • Agregue contexto de conversación para interacciones de varias vueltas.
  • Utilice las herramientas soportadas de la API de respuestas, como la búsqueda de archivos, el intérprete de código, las llamadas de función y las llamadas MCP.
  • Integre la API básica, como archivos, almacenes vectoriales y contenedores, en el mismo flujo de trabajo.

Conversaciones y memoria

La API de respuestas funciona con la API de conversaciones para que pueda mantener el contexto en las distintas giras en una conversación con varios giros.

OCI Generative AI también proporciona un recurso denominado proyectos. Un proyecto agrupa recursos de agente relacionados, como respuestas, conversaciones, archivos, contenedores y configuración de memoria.

En un proyecto, puede configurar el comportamiento de la memoria, que incluye:

  • Memoria a largo plazo para contexto persistente en interacciones relacionadas en el mismo proyecto
  • Memoria a corto plazo para el contexto llevado a cabo en una conversación en curso

Esto le permite organizar los flujos de trabajo de agentes relacionados y gestionar el contexto retenido de forma controlada.

Herramientas con la API Responses

El soporte de herramientas forma parte de la API Responses. Cuando envía una solicitud de API de respuestas, puede incluir definiciones de herramientas soportadas directamente en la solicitud.

OCI Generative AI soporta las siguientes herramientas de API de respuestas:

  • Búsqueda de Archivo
  • Intérprete de código
  • Llamada de función
  • Llamadas de MCP

Estas herramientas amplían lo que el modelo puede hacer durante un flujo de trabajo. A medida que OCI Generative AI amplía el soporte para más herramientas de API de respuestas, este conjunto puede crecer.

API básica con la API de respuestas

Si un flujo de trabajo necesita bloques de creación de nivel inferior, puede utilizar la API básica junto con la API de respuestas.

Estas API fundamentales incluyen:

  • Archivos
  • Almacenes de vectores
  • Contenedores

Estas API también son compatibles con OpenAI y funcionan sin problemas con la API de respuestas. Puede utilizarlos para admitir la recuperación, el manejo de documentos, la ejecución en sandbox y otras necesidades de flujo de trabajo del agente.

Búsqueda SQL (NL2SQL)

OCI Generative AI también proporciona SQL Search (NL2SQL) para flujos de trabajo de agente de IA empresarial. NL2SQL convierte las solicitudes en lenguaje natural en SQL validado para datos empresariales federados sin mover ni copiar los datos subyacentes. Los datos de origen se deben almacenar en Oracle Autonomous Database. NL2SQL utiliza una capa de enriquecimiento semántico para asignar términos de negocio a tablas, columnas y uniones de base de datos.

NL2SQL solo genera SQL y no ejecuta la consulta. Para utilizarlo, cree un almacén semántico respaldado por un almacén de vectores de datos estructurados, configure las conexiones necesarias, ejecute el enriquecimiento y, a continuación, llame a la API GenerateSqlFromNl. La ejecución de consultas se maneja por separado mediante el servidor MCP de DBTools, que autoriza y ejecuta la consulta en la base de datos de origen mediante permisos y guías de protección existentes.

Por qué utilizar este enfoque

Utilice el enfoque de la API Responses cuando desee:

  • Un inicio rápido para crear agentes
  • Ejecución gestionada por OCI sin gestionar la infraestructura
  • Sintaxis de solicitud compatible con OpenAI
  • Soporte flexible para modelos, conversaciones, herramientas y API fundamentales
  • Una arquitectura con API como elemento principal que puede crecer con su aplicación
  • Acceso a otras capacidades de agente de OCI como NL2SQL para flujos de trabajo de datos empresariales

En resumen, este enfoque te ofrece una forma rápida y flexible de crear agentes, mientras que OCI Generative AI gestiona el entorno de ejecución subyacente.

Enfoque 2: Despliegue de aplicaciones Agentic alojadas

Utiliza aplicaciones alojadas cuando desees empaquetar y desplegar tu propio tiempo de ejecución de agente en OCI Generative AI.

En este enfoque, OCI Generative AI proporciona un modelo de alojamiento gestionado basado en dos recursos:

  • Aplicaciones
  • Despliegues

Una aplicación define la configuración de la aplicación alojada. Un despliegue ejecuta una imagen de contenedor específica para esa aplicación.

Este enfoque es útil cuando ya tiene una aplicación auténtica que desea empaquetar, desplegar y ejecutar en una infraestructura gestionada por OCI.

Lo que se configura en una aplicación

Al crear una aplicación, se define la configuración de alojamiento principal para la aplicación agentic.

Esto incluye configuraciones como:

  • Comportamiento de escala de despliegue para gestionar la carga
  • Si la aplicación utiliza almacenamiento gestionado
  • El servicio de almacenamiento gestionado que utiliza la aplicación:
    • PostgreSQL OCI
    • Caché de OCI
    • Oracle Autonomous Database
  • VCN y subred para la aplicación
  • Si la aplicación utiliza puntos finales públicos o privados
  • Configuración del dominio de identidad de OCI IAM para la aplicación

Integración de aplicaciones de OCI IAM

Como parte del modelo de aplicación alojado, asigne una aplicación en un dominio de identidad de OCI.

Esta aplicación de dominio de identidad de OCI es una aplicación personalizada registrada en Oracle Cloud Infrastructure Identity and Access Management (OCI IAM). Controla el acceso de los usuarios y soporta la integración segura, la conexión única (SSO) y la propagación de identidades mediante protocolos OAuth.

Cómo funcionan los despliegues

Después de crear la aplicación, cree un despliegue dentro de esa aplicación.

Un despliegue utiliza la configuración definida por la aplicación y apunta a una imagen de contenedor específica que ha creado y transferido a OCI Container Registry.

El flujo típico es:

  1. Cree la imagen de contenedor
  2. Transfiera la imagen a OCI Container Registry
  3. Crear una aplicación en OCI Generative AI
  4. Crear un despliegue en esa aplicación
  5. Señalar el despliegue a la imagen del contenedor
  6. Ejecutar el despliegue y activarlo

El despliegue activo sirve solicitudes a través del punto final de la aplicación.

Por qué utilizar este enfoque

Utilice las aplicaciones alojadas cuando desee:

  • Para ejecutar su propio tiempo de ejecución de agente empaquetado en OCI
  • Infraestructura gestionada por OCI para alojamiento y escalado
  • Integración de identidad, almacenamiento y redes gestionadas
  • Un modelo de despliegue basado en imágenes de contenedor y OCI Container Registry
  • Una opción de alojamiento de producción para aplicaciones agentic

Este enfoque está diseñado para alojar aplicaciones ágiles en una infraestructura gestionada por OCI con soporte integrado para el despliegue y la escala automática.

Enfoque híbrido

Dado que ambos enfoques están disponibles, también puede utilizar un enfoque híbrido.

En una arquitectura híbrida, utiliza la API de respuestas para la orquestación de modelos, conversaciones, herramientas, API fundamentales y capacidades de soporte como NL2SQL, al tiempo que utiliza despliegues alojados para entornos de ejecución de agentes personalizados que empaqueta y opera en OCI.

Por ejemplo, podría:

  • Llamada a la API de respuestas de OCI para interacción de modelos y uso de herramientas
  • Utilizar la API de conversaciones y la memoria basada en proyectos para el manejo de contextos
  • Uso de archivos, almacenes vectoriales y contenedores como parte del flujo de trabajo
  • Uso de NL2SQL para la generación de lenguaje natural a SQL con datos empresariales federados
  • Desplegar un tiempo de ejecución de agente personalizado como una aplicación alojada

Esto le permite combinar capacidades de agente gestionado por OCI con componentes de aplicación empaquetados que desea ejecutar en OCI.

Decida qué enfoque se ajusta a su caso de uso

Utiliza el enfoque de API de respuestas cuando desees la forma más rápida y flexible de crear agentes con la ejecución de modelos gestionados por OCI, conversaciones, herramientas, API fundamentales y capacidades de soporte como NL2SQL.

Utilice aplicaciones alojadas cuando desee empaquetar y desplegar su propio tiempo de ejecución de agente y ejecutarlo en una infraestructura gestionada por OCI.

Utiliza un enfoque híbrido cuando tu arquitectura se beneficie de ambos modelos.

Diagrama

El diagrama muestra cómo encajan estas piezas. Por un lado está la aplicación de cliente o agente, que incluye SDK, marcos, peticiones de datos, configuración de modelo y herramientas locales. En el medio están la API y los recursos de OCI gestionados, incluida la API de respuestas de OCI, la memoria, los archivos, las tiendas vectoriales, los contenedores y las capacidades de herramientas relacionadas. Por otro lado, está la infraestructura y el tiempo de ejecución gestionados por OCI que se utiliza para ejecutar modelos, herramientas y cargas de trabajo alojadas, al tiempo que se integra con los servicios de OCI y los sistemas de terceros.

Diagrama de la plataforma OCI Generative AI Platform que muestra las aplicaciones alojadas que llaman a la API gestionada, la API de respuestas, las conversaciones, las tiendas vectoriales, los archivos y los contenedores) y un tiempo de ejecución de orquestación que llama a modelos y herramientas, almacena el estado y se integra con OCI y servidores de herramientas y modelos de terceros.