Despliegue de generación aumentada de recuperación de IA generativa multinube (RAG)
Utiliza OCI Generative AI y Oracle Integration en una solución multinube como Oracle Cloud Infrastructure y Microsoft Azure para consultar datos organizativos relevantes y utilizarlos para proporcionar respuestas altamente contextualizadas.
En una arquitectura de RAG, Oracle Integration puede desempeñar el rol de orquestador de datos, lo que garantiza que todos los orígenes de datos relevantes estén disponibles para la recuperación. A continuación, los agentes de Oracle Cloud Infrastructure Generative AI toman el control para aprovechar esos datos y proporcionar respuestas enriquecidas con contexto.
Los agentes GenAI de OCI procesan esos datos para proporcionar una respuesta contextual embebiendo los documentos recuperados y mejorando sus respuestas generadas consultando el modelo de lenguaje grande (LLM).
Por lo tanto, aunque ambos están involucrados en el ciclo de vida de los datos, sus roles son distintos pero complementarios en la creación de una arquitectura RAG multinube.
Este enfoque de RAG multinube proporciona:
- Flexibilidad multinube: la arquitectura integra múltiples plataformas en la nube (OCI y Azure), haciéndola adaptable al panorama de datos dentro de las empresas.
- Conectividad de alto rendimiento: Oracle Interconnect for Microsoft Azure garantiza una transferencia de datos rápida, segura y fiable entre entornos en la nube.
- Generación de contenido dinámico: el agente extrae la información más reciente de fuentes dispares, lo que garantiza que las respuestas de LLM sean precisas y relevantes.
- Búsqueda de documentos incrustada: mediante incrustaciones y búsqueda semántica, los agentes GenAI de OCI pueden proporcionar estadísticas más detalladas basadas en el contexto en lugar de solo coincidencias de palabras clave.
Arquitectura
Esta solución multinube obtiene datos de Microsoft Azure y Oracle Cloud Infrastructure (OCI), lo que permite a los agentes de Oracle Cloud Infrastructure Generative AI acceder a una gama más amplia de información actualizada.
Los agentes GenAI de OCI y Oracle Integration soportan conjuntamente los servicios de recuperación, aumento y generación (RAG) para proporcionar resultados altamente contextualizados.
Los agentes GenAI de OCI se centran específicamente en el uso de IA generativa para responder a las consultas de los usuarios mediante la recuperación de información relevante de bases de conocimientos o documentos para generar respuestas. El agente proporciona respuestas enriquecidas y adaptadas al contexto mediante el aprovechamiento de técnicas de IA avanzadas, incrustaciones y fragmentación de documentos para comprender y generar contenido relevante:
- Recuperar: Extrae datos relevantes de las fuentes de conocimiento, generalmente a través de la búsqueda híbrida avanzada, combinando búsqueda léxica y semántica.
- Aumento: utilice los datos recuperados para proporcionar contexto para una consulta, garantizando que el modelo de IA generativa tenga la información necesaria.
- Generar: utilice modelos de lenguaje grandes (LLM) para generar respuestas contextuales a las preguntas del usuario, a menudo mejoradas por los datos recuperados en los pasos anteriores.
Oracle Integration, por otro lado, proporciona servicios de integración que conectan varias aplicaciones y sistemas, lo que permite la orquestación de flujos de datos en varios entornos:
- Recuperar: Facilita la recuperación de datos de diferentes orígenes mediante agentes de conectividad para conectarse de forma privada a varios orígenes o servicios de datos (base de datos, API de REST, almacenamiento en la nube, etc.) en Azure u otros hiperescaladores.
- Orquesta/agregación: organiza flujos de trabajo e integra datos de varios orígenes, aumenta los procesos mediante el enriquecimiento de datos mediante transformaciones preconfiguradas o dinámicas.
- Gestionar flujo de datos: a diferencia del agente de RAG, Oracle Integration no se centra en generar respuestas a partir de datos, sino en permitir el movimiento y la transformación fluidos de datos entre sistemas y aplicaciones, garantizando que todos los datos relevantes estén disponibles para diferentes servicios.
Área funcional | Agentes GenAI de OCI | Oracle Integration |
---|---|---|
Finalidad | Diseñado para proporcionar respuestas basadas en IA mediante la recuperación de datos, el aumento de los mismos y el uso de un LLM para generar respuestas. | Diseñado para integrar y orquestar datos en varias aplicaciones, proporcionando una conectividad de datos perfecta pero sin las capacidades de generación basadas en LLM. |
Manejo de Datos | Utiliza datos para generar respuestas de lenguaje natural de una manera consciente del contexto. | Maneja el flujo de datos entre aplicaciones, actuando como un puente entre sistemas sin generar contenido de la misma manera que lo hace un LLM. |
Capacidades generativas | Tiene capacidades de IA generativa y utiliza LLM para generar respuestas conversacionales u otra salida. | No tiene capacidades de IA generativa y se utiliza para conectar, recuperar y transformar datos entre servicios. |
El siguiente diagrama ilustra el flujo de datos a través de la arquitectura:
multicloud-genai-rag-process-oracle.zip
- El usuario interactúa con Oracle Digital Assistant o con agentes GenAI de OCI, según la implantación, para entregar consultas y peticiones de datos de usuario.
- Oracle Integration organiza llamadas entre diferentes componentes: extracción de orígenes de datos, manejo de la ingesta de documentos y transferencia de peticiones de datos de usuario descendente.
- Los orígenes de datos incluyen:
- Oracle Interconnect for Microsoft Azure proporciona un enlace de gran ancho de banda entre OCI y Azure para repositorios de documentos, Oracle Database@Azure, etc.
- Los repositorios de archivos locales proporcionan archivos locales o locales para la ingesta.
- Servicios de OCI, como Oracle Fusion Cloud Enterprise Resource Planning.
- Oracle Database@Azure en una subred delegada para compartir datos en servicios gestionados por Oracle en Azure.
- El proceso de ingestión, fragmentación e incorporación de documentos se puede implantar de distintas formas:
- Oracle Integration (mediante bibliotecas personalizadas o JavaScript embebidas) realiza la fragmentación y llama a OCI Generative AI para embeberla.
- OCI Functions recibe documentos, los fragmenta y, a continuación, llama a OCI Generative AI para embeberlos.
- Oracle Autonomous Database 23ai realiza fragmentación e incrustación mediante la funcionalidad vectorial.
El resultado estándar es un conjunto de incrustaciones de fragmentos de texto y vectores completamente gestionados en el contexto multinube.
- Los vectores y fragmentos se almacenan en Oracle Autonomous Database 23ai:
- El enfoque típico es almacenar incrustaciones en el índice vectorial de Oracle Autonomous Database 23ai.
- El propio texto de fragmento también se puede almacenar directamente en un CLOB de base de datos (para una recuperación rápida) o como referencias que apuntan al texto de fragmento en OCI Object Storage o en Azure Data Lake.
- OCI Object Storage puede almacenar los documentos originales si es necesario, pero no es necesario que mantenga las incrustaciones allí si consulta el almacén de vectores en la base de datos.
- Cuando el usuario solicita una pregunta, los agentes GenAI de OCI (o el asistente digital) llaman a Oracle Autonomous Database 23ai para realizar una búsqueda de similitud vectorial mediante la embebida de la petición de datos del usuario para identificar los mejores fragmentos coincidentes en función de las puntuaciones de similitud vectorial.
- OCI Generative AI genera incrustaciones para preguntas y fragmentos de documentos y genera respuestas mediante modelos de LLM, proporcionando respuestas enriquecidas contextualmente. La recuperación de fragmentos y la respuesta del LLM también dependen de la implementación:
- Si el texto de fragmento se almacena en la base de datos, se puede recuperar directamente.
- Si solo se almacenan referencias, el sistema recupera rápidamente el contenido de fragmento real de OCI Object Storage, Azure Data Lake u otro repositorio.
- A continuación, los fragmentos relevantes se envían al LLM en OCI Generative AI junto con la petición de datos original del usuario para producir una respuesta enriquecida contextualmente.
- La respuesta final la devuelve Oracle Digital Assistant o la interfaz de agentes GenAI de OCI, según el front-end al que esté conectado el usuario.
En el siguiente diagrama, se ilustra la arquitectura:
multinube-genai-rag-architecture-oracle.zip
- Región de Microsoft Azure
Una región de Azure es un área geográfica en la que residen uno o más centros de datos físicos de Azure, denominados zonas de disponibilidad. Las regiones son independientes entre sí y pueden separarse grandes distancias (entre países o incluso continentes).
Las regiones de Azure y OCI son áreas geográficas localizadas. Para Oracle Database@Azure, una región de Azure está conectada a una región de OCI, con zonas de disponibilidad (AZ) en Azure conectadas a dominios de disponibilidad (AD) en OCI. Se seleccionan pares de regiones de Azure y OCI para minimizar la distancia y la latencia.
- Zona de disponibilidad de Microsoft Azure
Una zona de disponibilidad es un centro de datos físicamente separado dentro de una región diseñada para ser altamente disponible y tolerante a fallos. Las zonas de disponibilidad están lo suficientemente cerca como para tener conexiones de baja latencia a otras zonas de disponibilidad.
- Red virtual de Microsoft Azure
Microsoft Azure Virtual Network (VNet) es el componente fundamental de una red privada en Azure. VNet permite que muchos tipos de recursos de Azure, como máquinas virtuales (VM) de Azure, se comuniquen de forma segura entre sí, con Internet y con redes locales.
- Subred delegada de Microsoft Azure
La delegación de subred permite inyectar un servicio gestionado, específicamente un servicio de plataforma como servicio (PaaS), directamente en la red virtual. Una subred delegada puede ser un directorio raíz de un servicio gestionado externamente dentro de la red virtual para que el servicio externo actúe como recurso de red virtual, aunque sea un servicio PaaS externo.
- Almacenamiento de lago de datos de Microsoft Azure
Data Lake Storage es una solución de lago de datos empresarial basada en la nube. Está diseñado para almacenar grandes cantidades de datos en cualquier formato y para facilitar las cargas de trabajo analíticas de big data. Se utiliza para capturar datos de cualquier tipo y velocidad de ingestión en una única ubicación para facilitar el acceso y el análisis mediante varios marcos.
- Microsoft Azure Synapse Analytics
Azure Synapse Analytics combina un servicio centralizado para el almacenamiento y procesamiento de datos con una arquitectura de servicios enlazados extensible que le permite integrar almacenes de datos, plataformas de procesamiento y herramientas de visualización de uso común.
Oracle Cloud Infrastructure proporciona los siguientes componentes:
- Región
Una región de Oracle Cloud Infrastructure es un área geográfica localizada que contiene uno o más centros de datos, denominados dominios de disponibilidad. Las regiones son independientes entre sí y pueden separarse grandes distancias (entre países o incluso continentes).
- Dominio de disponibilidad
Los dominios de disponibilidad son centros de datos independientes dentro de una región. Los recursos físicos de cada dominio de disponibilidad están aislados de los recursos de los otros dominios de disponibilidad, lo que proporciona tolerancia a fallos. Los dominios de disponibilidad no comparten infraestructura, como la alimentación o la refrigeración, ni la red interna del dominio de disponibilidad. Por tanto, un fallo en un dominio de disponibilidad no debería afectar a los demás dominios de disponibilidad de la región.
- Red y subredes virtuales en la nube (VCN)
Una VCN es una red personalizable definida por software que se configura en una región de Oracle Cloud Infrastructure. Al igual que las redes de los centros de datos tradicionales, las redes virtuales le proporcionan el control de su entorno de red. Una VCN puede tener varios bloques de CIDR no superpuestos que puede cambiar después de crear la VCN. Puede segmentar una VCN en subredes, las cuales se pueden acotar a una región o a un dominio de disponibilidad. Cada subred está formada por un rango contiguo de direcciones que no se solapan con las demás subredes de la VCN. Puede cambiar el tamaño de una subred después de la creación. Una subred puede ser pública o privada.
- Tabla de rutas
Las tablas de rutas virtuales contienen reglas para enrutar el tráfico de subredes a destinos fuera de una VCN, normalmente a través de gateways.
- Lista de seguridad
Para cada subred, puede crear reglas de seguridad que especifiquen el origen, el destino y el tipo de tráfico que se debe permitir dentro y fuera de la subred.
- IA generativa
Oracle Cloud Infrastructure Generative AI es un servicio OCI totalmente gestionado que proporciona un conjunto de modelos de lenguaje grandes (LLM) personalizables y de última generación que abarcan una amplia gama de casos de uso para la generación de texto, el resumen y la búsqueda semántica, entre otros. Utiliza el patio de recreo para probar los modelos preentrenados listos para usar, o crea y aloja tus propios modelos personalizados ajustados basados en tus propios datos en clusters de IA dedicados.
- Integración
Oracle Integration es un entorno totalmente gestionado y preconfigurado que permite integrar aplicaciones en la nube y locales, automatizar procesos de negocio y desarrollar aplicaciones visuales. Utiliza un servidor de archivos compatible con SFTP para almacenar y recuperar archivos y le permite intercambiar documentos con partners comerciales de negocio a negocio mediante una cartera de cientos de adaptadores y recetas para conectarse con aplicaciones de Oracle y de terceros.
- Almacenamiento de objetos
OCI Object Storage proporciona acceso rápido a grandes cantidades de datos estructurados y no estructurados de cualquier tipo de contenido, incluidas copias de seguridad de base de datos, datos analíticos y contenido enriquecido, como imágenes y vídeos. Puede almacenar datos de forma segura directamente desde Internet o desde la plataforma en la nube. Puede ampliar el almacenamiento sin experimentar ninguna degradación del rendimiento ni de la fiabilidad del servicio.
Utilice el almacenamiento estándar para el almacenamiento al que debe acceder de forma rápida, inmediata y frecuente. Utilice el almacenamiento de archivo para el almacenamiento "frío" al que conserva durante largos períodos de tiempo y al que rara vez accede.
- Funciones
Oracle Cloud Infrastructure Functions es una plataforma de funciones como servicio (FaaS) totalmente gestionada, multi-inquilino, altamente escalable y a demanda. Se basa en el motor de origen abierto Fn Project. OCI Functions permite desplegar el código y llamarlo directamente o dispararlo en respuesta a eventos. OCI Functions utiliza contenedores de Docker alojados en Oracle Cloud Infrastructure Registry.
- Análisis
Oracle Analytics Cloud es un servicio en la nube pública escalable y seguro que brinda a los analistas empresariales capacidades modernas de análisis de autoservicio basadas en IA para la preparación de datos, la visualización, la generación de informes empresariales, el análisis aumentado y el procesamiento y la generación de lenguaje natural. Con Oracle Analytics Cloud, también obtiene capacidades de gestión de servicios flexibles, como una configuración rápida, una ampliación y aplicación de parches fáciles y una gestión automatizada del ciclo de vida.
- Digital Assistant
Oracle Digital Assistant es una plataforma que permite crear y desplegar asistentes digitales para sus usuarios. Con Oracle Digital Assistant, puede crear interfaces basadas en IA (o bots conversacionales) para aplicaciones empresariales a través de interfaces de texto, chat y voz. Cada asistente digital tiene una recopilación de una o más aptitudes especializadas para ayudar a los usuarios a realizar diversas tareas en conversaciones en lenguaje natural. Por ejemplo, un asistente digital individual puede tener aptitudes que se centren en tipos específicos de tareas, como el seguimiento del inventario, el envío de fichas de horas y la creación de informes de gastos.
- Autonomous Database
Oracle Autonomous Database es un entorno de base de datos totalmente gestionado y preconfigurado que puede utilizar para el procesamiento de transacciones y las cargas de trabajo de almacenamiento de datos. No necesita configurar ni gestionar ningún hardware, ni instalar ningún software. Oracle Cloud Infrastructure gestiona la creación, la copia de seguridad, la aplicación de parches, el cambio de versión y el ajuste de la base de datos.
Explorar más
Obtenga más información sobre las funciones de esta arquitectura y sobre las arquitecturas relacionadas.
-
RAG a la realidad: Amplifica la IA y reduce los costos (blog)
-
Creación de una pila de IA generativa de nivel empresarial en Oracle Cloud Infrastructure
-
Implantar la generación aumentada de recuperación mediante Oracle Integration
-
Implementa una gestión de consultas de clientes perfecta con OCI Generative AI y Oracle Integration
-
Activar integraciones multinube de Oracle Cloud ERP a Microsoft Azure SQL Database
-
Obtén más información sobre Oracle Maximum Availability Architecture for Oracle Database@Azure
-
Más información sobre la selección de topologías de red para Oracle Database@Azure