Acerca del uso de Oracle AI Database 26ai para la IA empresarial

Permite que tu empresa convierta los datos empresariales gestionados en Oracle AI Database 26ai en conocimientos controlados y de alta calidad que impulsan las aplicaciones de IA sin agregar almacenes vectoriales independientes. Con el pipeline de conocimientos de Dify Enterprise Edition, puedes orquestar la ingestión, el enriquecimiento y la indexación de datos multimodales (texto, imágenes y audio) directamente en Oracle AI Database 26ai. A continuación, puede poner en funcionamiento una recuperación rápida y fiable para casos de uso como copilotos de soporte al cliente, búsqueda de conocimientos y flujos de trabajo asistidos por agentes con las siguientes ventajas:
  • Acelera el plazo para la obtención de resultados de la IA mediante la activación de datos existentes residentes en Oracle
  • Mejore la calidad y coherencia de las respuestas con un contexto seleccionado y alineado con las políticas
  • Amplíe con confianza el rendimiento, la disponibilidad y la seguridad empresariales de Oracle
  • Reduce la complejidad arquitectónica unificando el almacenamiento de datos y la gestión de vectores
En este manual de soluciones, aprenderá a integrar Dify con Oracle AI Database para ofrecer una referencia repetible para crear aplicaciones de generación aumentada de recuperación (RAG) y conocimiento que se ejecuten a escala de producción.

Arquitectura

Dify se ejecuta en Oracle Cloud Infrastructure Kubernetes Engine (OKE) en varios dominios de disponibilidad dentro de una única red virtual en la nube (VCN) tras un diseño de red de tres niveles.

La siguiente arquitectura muestra un despliegue típico de tres niveles de Dify en OCI en una región de OCI y una única VCN que abarca tres dominios de disponibilidad para alta disponibilidad:



oracle-adb-dify-arch-oracle.zip

La siguiente lista resume el despliegue y la conectividad:

  • Un usuario local se conecta a la aplicación a través de Internet.
  • Las solicitudes terminan en un equilibrador de carga público proporcionado por el equilibrador de carga de OCI (LB) en una VCN.
  • Presente la plataforma con un controlador de entrada y un equilibrador de carga de OCI para obtener acceso externo a la consola y los servicios de Dify.
  • Las bases de datos públicas requieren dos subredes públicas en dominios de disponibilidad (AD) diferentes para una alta disponibilidad (HA).
  • Despliegue Dify Enterprise Edition en OKE dentro de una VCN que abarque varios dominios de disponibilidad.
  • El cluster expone un punto final de la interfaz de programación de aplicaciones (API) de kubernetes y ejecuta varios nodos de trabajador.
  • Cada nodo aloja pods de aplicación. Utilice una subred de pod privada dedicada con gateways de NAT para que los pods se conecten a Internet sin estar expuestos públicamente.
  • Las imágenes de contenedor se extraen de OCI Container Registry a través de Oracle Services Network (OSN) mediante un gateway de servicio.
  • Utiliza Oracle AI Database 26ai como base de datos vectorial, aprovechando su almacenamiento/recuperación vectorial nativa y las funciones empresariales (particiones, RAC, fragmentación, optimización de Exadata) para la escala y la fiabilidad.

La arquitectura tiene los siguientes componentes:

  • Región OCI

    Una región de OCI es un área geográfica localizada que contiene uno o más centros, denominados dominios de disponibilidad. Las regiones son independientes de otras regiones y pueden haber grandes distancias que las separan (entre países o incluso continentes).

  • Dominio de disponibilidad

    Los dominios de disponibilidad son centros de datos independientes dentro de una región. Los recursos físicos de cada dominio de disponibilidad están aislados de los recursos de los otros dominios de disponibilidad, lo que proporciona tolerancia a fallos. Los dominios de disponibilidad no comparten infraestructura, como la alimentación o la refrigeración, ni la red interna del dominio de disponibilidad. Por lo tanto, un fallo en un dominio de disponibilidad no debería afectar a los demás dominios de disponibilidad de la región.

  • Red virtual en la nube y subred de OCI

    Una red virtual en la nube (VCN) es una red personalizable y definida por software que se configura en una región de OCI. Al igual que las Redes de los Centros de Datos Tradicionales, las Redes Virtuales le proporcionan el control sobre su entorno de red. Una VCN puede tener varios bloques de CIDR no superpuestos que puede cambiar después de crear la VCN. Puede segmentar una VCN en subredes, las cuales se pueden acotar a una región o a un dominio de disponibilidad. Cada subred está formada por un rango contiguo de direcciones que no se solapan con las demás subredes de la VCN. Puede cambiar el tamaño de una subred después de la creación. Una subred puede ser pública o privada.

  • Equilibrador de carga

    Oracle Cloud Infrastructure Load Balancer proporciona la distribución automatizada de tráfico desde un único punto para acceder a varios servidores.

  • OCI Kubernetes Engine

    Oracle Cloud Infrastructure Kubernetes Engine (OCI Kubernetes Engine o OKE) es un servicio totalmente gestionado, escalable y de alta Disponibilidad que puede utilizar para desplegar aplicaciones de contenedores en la nube. Especifique los recursos informáticos que necesitan sus aplicaciones y OKE los aprovisiona en OCI en un arrendamiento existente. OKE utiliza Kubernetes para automatizar el despliegue, la ampliación y la gestión de aplicaciones en contenedores en clusters de hosts.

  • Oracle AI Database 26ai

    Oracle AI Database 26ai con AI Vector Search te permite consultar datos por significado en lugar de palabras clave. Las representaciones vectoriales (embeddings) capturan la semántica del texto, las imágenes, el audio y más para que pueda encontrar contenido similar de manera eficiente. Las funciones de distancia SQL incorporadas permiten búsquedas de similitud mediante vectores. Puede combinar la similitud semántica y otros criterios de búsqueda para fundamentar modelos de lenguaje grandes (RAG) para obtener respuestas más precisas y relevantes.

  • Oracle Autonomous AI Database

    Oracle Autonomous AI Database proporciona un base de datos fácil de usar, totalmente autónoma (autogestionada) que puede ampliarse de forma flexible y ofrecer un rendimiento de consultas rápido. Como servicio, no requiere la administración de la base de datos. No necesita configurar ni gestionar ningún hardware ni instalar ningún software. Gestiona automáticamente el aprovisionamiento, las copias de seguridad, la aplicación de parches y la actualización, así como el crecimiento o la reducción de la base de datos y es un servicio flexible. Desarrolla aplicaciones escalables basadas en IA con cualquier dato utilizando capacidades de IA integradas. Utiliza tu elección de modelo de lenguaje grande (LLM) e implementa en la nube o en tu centro de datos.

Casos de uso

A medida que las empresas implementan planes de desarrollo de IA basados en modelos de lenguaje grandes (LLM) y datos privados, Oracle AI Database 26ai, con sus dos ventajas de gestión vectorial nativa y características empresariales maduras, proporciona una solución de plataforma de datos estable, eficiente y de bajo umbral para el marco de desarrollo del agente de Dify Oracle AI Database y las aplicaciones de IA basadas en Dify.

  • Reutilización de recursos y optimización de costos: las empresas ya no necesitan adquirir bases de datos vectoriales dedicadas y pueden reutilizar por completo los recursos existentes de Oracle AI Database, lo que reduce significativamente los costos de adquisición y mantenimiento del hardware.
  • Escalabilidad de la capacidad: a medida que los datos multimodales (como imágenes industriales y registros de audio) se vuelven cada vez más comunes en las aplicaciones de IA empresarial, Oracle AI Database 26ai puede ampliar aún más las capacidades de recuperación de vectores multimodales, proporcionando un soporte de IA más completo para escenarios como la fabricación inteligente y el diagnóstico médico.
  • Garantía de estabilidad: aprovechando los años de experiencia de Oracle AI Database en partición, RAC y optimización de Exadata, Oracle AI Database 26ai puede manejar fácilmente volúmenes de datos a nivel de petabytes y escenarios de alta simultaneidad, lo que garantiza un funcionamiento estable las 24 horas del día, los 7 días de la semana para las aplicaciones de IA empresarial.

Oracle AI Database 26ai no solo es el principal proveedor de gestión de datos vectoriales empresariales, sino también la base técnica clave para promover la transformación de las empresas del almacenamiento de datos a la minería de valor de IA, proporcionando un soporte técnico sólido para las actualizaciones inteligentes empresariales.

Consideraciones

Al integrar Dify con OCI, tenga en cuenta estas opciones.

  • Utilice subredes privadas para niveles de aplicación/datos y NSG sobre listas de seguridad siempre que sea posible.
  • Utilice OCI Vault para secretos (claves de API, creds de base de datos), políticas de IAM con menos privilegios y OCI Logging, Monitoring y Alarmas para la observabilidad.
  • Considere la posibilidad de utilizar varios pools de nodos de dominios de disponibilidad y comprobaciones del sistema del equilibrador de carga para comprobar la alta disponibilidad y la escala automática.

Acerca de los servicios y los roles necesarios

Esta solución requiere los siguientes servicios y roles:

  • Oracle Cloud Infrastructure
  • Oracle Autonomous AI Database
  • OCI Kubernetes Engine
  • Dify Enterprise Edition

Estos son los roles necesarios para cada servicio.

Nombre de servicio: Rol Necesario para...
Dify: Usuario Cree un usuario Dify identificado por el tablespace por defecto de contraseña con la cuota de usuarios unlimited.
Dify: DB_DEVELOPER_ROLE Permite a los administradores asignar rápidamente los privilegios que necesitan los desarrolladores para diseñar, crear y desplegar aplicaciones para Oracle Database.

Consulte Productos, soluciones y servicios de Oracle para obtener lo que necesita.