Activación de un motor de aplicaciones LLM modular con poco código mediante Oracle Integration y OCI Generative AI

Oracle Integration es un servicio totalmente gestionado que permite un enfoque con poco código o sin código para la conectividad empresarial, las extensiones y las capacidades de automatización para modernizar rápidamente aplicaciones, procesos de negocio, API y datos. Con una experiencia de desarrollo visual, integraciones predefinidas y mejores prácticas integradas, Oracle Integration puede orquestar API, aplicaciones, sistemas, etc. y permitir flujos de negocio y aplicaciones personalizadas basadas en IA y en humanos.

Oracle Cloud Infrastructure Generative AI (OCI Generative AI) es un servicio totalmente gestionado que proporciona un juego de modelos de lenguaje grandes (LLM) personalizables y de última generación que abarcan una amplia gama de casos de uso para la generación, el resumen, la incorporación y la finalización de chat de texto. Puede utilizar el patio de recreo, una interfaz en la consola para explorar los modelos alojados previamente entrenados y personalizados sin escribir una sola línea de código ni crear y alojar sus propios modelos personalizados ajustados basados en sus propios datos en clusters de IA dedicados.

Combinación de servicios de Oracle Integration y OCI Generative AI con otros servicios de OCI como Oracle Cloud Infrastructure Streaming (OCI Streaming, un servicio de Kafka gestionado por Oracle), OCI Document Understanding (servicio sin servidor al que se puede acceder mediante llamadas de API de REST para reconocimiento óptico de caracteres (OCR), extracción de texto, extracción de valor clave, extracción de tablas y clasificación de documentos), Oracle Cloud Infrastructure Language (servicio sin servidor al que se puede acceder mediante llamadas de API de REST para el análisis de sentimientos de texto, reconocimiento de entidades con nombre, clasificación y mucho más), OCI Vision (servicio sin servidor accesible mediante llamadas de API de REST para detección de objetos y clasificación de imágenes), Oracle Cloud Infrastructure Data Science (plataforma totalmente gestionada y sin servidor que los equipos de ciencia de datos pueden utilizar para crear, entrenar, y gestionar el aprendizaje automático: modelos de aprendizaje automático) y otros mediante los adaptadores nativos y el enfoque de desarrollo visual de Oracle Integration, le ofrece la posibilidad de activar aplicaciones personalizadas basadas en LLM modulares, escalables, mantenibles y protegidas.

Arquitectura

Esta arquitectura de referencia proporciona las consideraciones y recomendaciones necesarias para activar un motor de aplicaciones LLM basado en IA, modular y basado en eventos, mediante:

  • Un enfoque con poco código o sin código para los flujos del cargador de datos y del motor de consultas de la aplicación LLM con herramientas de orquestación visual de Oracle Integration y adaptadores nativos para diferentes canales de datos sociales, de productividad y de negocio (los usuarios introducen en el motor de aplicaciones LLM, ya sea documentos, imágenes, datos de negocio o consultas) y orígenes (origen de los datos utilizados por el motor de aplicaciones de LLM), así como adaptadores nativos a los diferentes servicios de OCI utilizados por el motor de aplicaciones de LLM (API de REST de OCI Generative AI, bases de datos o almacenes de vectores, API de REST de Oracle Cloud Infrastructure Language, puntos finales de REST de modelo personalizado de Oracle Cloud Infrastructure Data Science, etc.). Esto ayuda a configurar rápidamente los flujos de negocio de la aplicación LLM
  • Patrón controlado por eventos para disociar los canales y orígenes de datos de documento, imagen y negocio, así como los canales de consulta de los módulos de cargador de datos y motor de consultas del motor de aplicaciones de LLM mediante el servicio OCI Streaming (servicio de Kafka gestionado por Oracle) y el adaptador nativo que tenemos para este servicio de OCI en Oracle Integration. Esto ayuda a activar una aplicación LLM escalable y de gran rendimiento.
  • Una conexión privada a la nube de 3a parte, aplicaciones locales, sistemas, etc., mediante el agente de conectividad de Oracle Integration, que es el habilitador clave para arquitecturas de integración híbrida y multinube, especialmente en una aplicación LLM donde los documentos, imágenes, datos de negocio, consulta de los usuarios pueden venir de esos sistemas y desea mantener el tránsito de documentos y datos privados y seguros. Esto ayuda a mejorar la seguridad del flujo LLM de extremo a extremo, manteniendo el tráfico dentro de las redes privadas.
  • La posibilidad de utilizar modelos de LLM nativos o modelos de LLM personalizados ajustados en su aplicación de LLM como servicios en OCI (coordinación de puntos finales de modelo de OCI Generative AI o puntos finales de modelo de OCI Data Science mediante adaptadores nativos en la nube de Oracle Integration).
  • Un enfoque flexible para conectar o desconectar su propia interfaz de usuario (IU) para la aplicación LLM con el motor de aplicación LLM, o un enfoque con poco código para crear la interfaz de usuario mediante Visual APP Builder en Oracle Integration u Oracle APEX.

El siguiente diagrama ilustra esta arquitectura de referencia.



oci-lowcode-ai-arch-oracle.zip

El motor de aplicaciones LLM de bajo código se compone de 2 bloques principales:

Cargador de datos de documento, imagen y negocio
Descripción de oci-generative-ai-llm-data-loader-arch.png siguiente
Descripción de la ilustración oci-generative-ai-llm-data-loader-arch.png

oci-generative-ai-llm-data-loader-arch-oracle.zip

  • Este bloque recibe primero los documentos de entrada, imágenes o datos de negocio agregados por un usuario a través de un canal social o de productividad (por ejemplo, WhatsApp, Outlook, Gmail, Twitter, etc.), un canal de datos de negocio (por ejemplo, aplicación web local de 3a parte o en la nube, sistema de gestión de contenido, almacenamiento en la nube de 3a parte como Microsoft Azure Cloud Storage, AWS S3, GoogleAlmacenamiento en la nube, FTP, servidor de archivos, ERP, CX, HCM: aplicaciones locales o SaaS, etc.), una interfaz de usuario personalizada de Knowledge Search Engine (por ejemplo, una interfaz de usuario personalizada creada con herramientas de aplicaciones visuales con poco código como Visual Builder en Oracle Integration u Oracle APEX en Oracle Database) o directamente en un cubo de OCI Object Storage, mediante flujos de orquestación visual de Oracle Integration y adaptadores nativos.
  • Los documentos, imágenes o datos de negocio se extraen en función del tipo de entrada. Por ejemplo, para el objeto de imagen, la detección de texto puede utilizar el servicio OCI AI Vision, para la clasificación de documentos, la extracción puede utilizar el servicio OCI AI Document Understanding, para tipos específicos de imágenes, documentos que puede utilizar una función sin servidor en su lenguaje de programación preferido mediante OCI Functions, etc.).
  • Los documentos, imágenes o datos de negocio pueden ser procesados por:
    • Extracción de metadatos mediante el servicio OCI AI Language (por ejemplo, entidad, extracción de palabras clave, extracción de frases de clave, análisis de sentimientos, detección y ocultación de información de identificación personal/PII, etc.) para una recuperación de contexto más relevante (por ejemplo, para activar la generación aumentada de recuperación (RAG), etc.).
    • Incrustación de los datos con un modelo de LLM mediante el servicio OCI Generative AI para una recuperación de contexto más relevante (por ejemplo, para activar la generación aumentada de recuperación (RAG), etc.).
    • Resumen de los datos con un modelo de LLM mediante el servicio OCI Generative AI para una recuperación de contexto más relevante (por ejemplo, para activar un índice de resumen para la búsqueda en varios documentos, también denominado recuperación jerárquica estructurada, etc.).
    • Almacenamiento de los datos en un almacén relacional para realizar una búsqueda adicional en datos estructurados (por ejemplo, Oracle Database, Oracle Database Cloud Service, Autonomous Database, MySQL, PostgreSQL, etc.).
    • Indexación de los datos en un almacén de vectores para realizar una búsqueda adicional en datos no estructurados (por ejemplo, vector, resumen, índices de palabras clave con OCI AI Vector Search, servicio de búsqueda de OCI con OpenSearch, Qdrant, etc.).

      Nota: La nueva función de búsqueda de similitud de vectores de IA estará disponible en Oracle Database 23.4c.

Motor de consultas
Descripción de oci-generative-ai-llm-query-engine-arch.png
Descripción de la ilustración oci-generative-ai-llm-query-engine-arch.png

oci-generative-ai-llm-query-engine-arch-oracle.zip

  • Este bloque primero recibe la consulta de entrada de un usuario a través de un canal social de productividad (por ejemplo, Whatsapp, Outlook, Gmail, etc.), un canal de datos de negocio (por ejemplo, aplicación web local/en la nube de 3a parte, o desde una interfaz de usuario personalizada de Knowledge Search Engine (por ejemplo, una interfaz de usuario personalizada creada mediante herramientas de aplicaciones visuales con poco código como Visual Builder en Oracle Integration u Oracle APEX en Oracle Database) mediante flujos de orquestación visual de Oracle Integration y adaptadores nativos.
  • La consulta entra en el pipeline de consulta mediante Oracle Integration, donde se puede procesar mediante:
    • Filtrado de la consulta mediante el servicio OCI Generative AI para evitar la inyección de petición de datos.
    • Reescritura o transformación de la consulta mediante el servicio OCI Generative AI para obtener una mejor recuperación del contexto relevante.
    • Enrutamiento de la consulta con selectores del motor de consultas mediante OCI Generative AI, para determinar cómo ejecutar la consulta sobre los datos como resumen de datos, como recuperación de contexto específica.
    • Extracción del historial de conversaciones de un almacén de historial de chat mediante OCI Cache con Redis, en caso de casos de uso de finalización de chat en los que se necesita memoria de chat.
    • Incrustación de la consulta mediante el servicio OCI Generative AI para casos de uso de recuperación de contexto relevantes (por ejemplo, para activar la generación aumentada de recuperación (RAG), etc.).
    • Enrutamiento de los recuperadores de contexto relevantes mediante el servicio OCI Generative AI para determinar de qué orígenes de datos obtener datos para responder a la consulta de entrada.
    • Recuperación de los datos de contexto relevantes para responder a la consulta de los almacenes de vectores (por ejemplo, OCI AI Vector Search, OCI Search Service with OpenSearch, Qdrant, etc.) para casos de uso de recuperación de generación aumentada (RAG), almacenes relacionales (por ejemplo, Oracle Database, Oracle Database Cloud Service, Autonomous Database, MySQL, PostgreSQL y para buscar en datos de negocio estructurados u orígenes de datos sociales, de productividad y de negocio (por ejemplo, Twitter, Outlook, Gmail, aplicaciones ERP/HCM/CX, etc.) para realizar búsquedas a demanda en datos de negocio, todo orquestado por Oracle Integration con adaptadores nativos para conectarse a estos orígenes de datos.
    • Nueva clasificación de los datos de contexto relevantes recuperados mediante un modelo de nueva clasificación desplegado y expuesto en OCI Data Science, con el fin de optimizar la búsqueda.
    • Generar la respuesta final a la consulta mediante las capacidades del servicio OCI Generative AI para el resumen, la generación y la finalización del chat.

La arquitectura tiene los siguientes componentes:

  • Oracle Integration

    Oracle Integration es un servicio totalmente gestionado y una plataforma de automatización, extensión y conectividad empresarial con poco código para modernizar rápidamente aplicaciones, procesos de negocio, API y datos. Los desarrolladores y arquitectos de la nube pueden conectar SaaS y aplicaciones locales seis veces más rápido con una experiencia de desarrollo visual, integraciones predefinidas y mejores prácticas integradas. Oracle Integration te da acceso nativo a eventos en Oracle Cloud ERP, HCM y CX. Conecte silos analíticos específicos de la aplicación para simplificar el proceso de solicitud a recepción, de selección a pago, de oportunidad potencial a factura y otros procesos críticos. Por último, ofrezca a sus líderes de TI y de negocio una visibilidad integral.

  • IA generativa de OCI

    Oracle Cloud Infrastructure (OCI) Generative AI es un servicio totalmente gestionado disponible a través de una API para integrar sin problemas estos modelos de lenguaje versátiles en una amplia gama de casos de uso, incluida la asistencia de escritura, el resumen y el chat. El servicio OCI Generative AI incluye los siguientes modelos fundamentales:

    • Generación: proporcione instrucciones para generar texto o extraer información del texto.
    • Resumen: Resume el texto con el formato, la longitud y el tono indicados.
    • Incrustación: convierte texto en incrustaciones de vector para utilizarlo en aplicaciones para búsquedas semánticas, clasificación de texto o agrupación en clusters de texto.
  • OCI Document Understanding

    OCI Document Understanding es un servicio de IA que permite a los desarrolladores extraer texto, tablas y otros datos clave de archivos de documentos a través de API y herramientas de interfaz de línea de comandos. Con OCI Document Understanding, puedes automatizar tediosas tareas de procesamiento de negocios con modelos de IA predefinidos y personalizar la extracción de documentos para satisfacer las necesidades específicas de tu sector.

  • Oracle Cloud Infrastructure Language

    OCI Language es un servicio sin servidor y varios clientes al que se puede acceder mediante llamadas a la API de REST. Proporciona modelos previamente entrenados que, con frecuencia, se vuelven a entrenar y supervisar para obtener los mejores resultados. El idioma proporciona capacidades de inteligencia artificial y aprendizaje automático para detectar el idioma en el texto no estructurado. Además, proporciona otras herramientas para ayudarle a obtener más información sobre el texto.

  • OCI Vision

    OCI Vision es un servicio de IA para realizar análisis de imágenes basados en aprendizaje profundo a escala. Con modelos predefinidos disponibles listos para usar, los desarrolladores pueden crear fácilmente reconocimiento de imágenes y texto en sus aplicaciones sin experiencia en aprendizaje automático (ML). Para casos de uso específicos del sector, los desarrolladores pueden entrenar automáticamente modelos de Vision personalizados con sus propios datos. Estos modelos se pueden utilizar para detectar anomalías visuales en la fabricación, extraer texto de documentos para automatizar los flujos de trabajo de negocio y etiquetar elementos en imágenes para contabilizar productos o envíos. Además de obtener acceso a modelos previamente entrenados, los desarrolladores pueden crear modelos personalizados sin experiencia en ciencia de datos ni gestionar la infraestructura de modelos personalizados.

  • Object Storage

    Object Storage proporciona acceso rápido a grandes cantidades de datos estructurados y no estructurados de cualquier tipo de contenido, incluidas copias de seguridad de base de datos, datos analíticos y contenido enriquecido, como imágenes y vídeos. Puede almacenar datos de forma segura y, a continuación, recuperarlos directamente desde Internet o desde la plataforma en la nube. Puede escalar el almacenamiento sin problemas sin experimentar ninguna degradación del rendimiento ni de la fiabilidad del servicio. Utilice el almacenamiento estándar para el almacenamiento de acceso frecuente al que debe acceder de forma rápida, inmediata y frecuente. Utilice el almacenamiento de archivo para el almacenamiento "en frío" que conserva durante largos períodos de tiempo y a los que rara vez accede.

  • Data Science

    Oracle Cloud Infrastructure Data Science es una plataforma totalmente gestionada y sin servidor que los equipos de ciencia de datos pueden utilizar para crear, entrenar y gestionar modelos de aprendizaje automático (ML) en Oracle Cloud Infrastructure (OCI). Se puede integrar fácilmente con otros servicios de OCI, como Oracle Autonomous Data Warehouse, Oracle Cloud Infrastructure Object Storage, etc. Puede crear y evaluar modelos de aprendizaje automático de alta calidad que aumenten la flexibilidad del negocio al poner los datos de confianza de la empresa a trabajar rápidamente, y puede respaldar objetivos empresariales basados en datos con un despliegue más fácil de modelos de aprendizaje automático.

  • Servicio de búsqueda de OCI con OpenSearch

    OCI Search Service with OpenSearch es un motor de estadísticas que se ofrece como servicio gestionado por Oracle. Sin tiempo de inactividad, Oracle automatiza la aplicación de parches, la actualización, la actualización, la realización de copias de seguridad y el cambio de tamaño del servicio. Los clientes pueden almacenar, buscar y analizar grandes volúmenes de datos rápidamente y ver los resultados casi en tiempo real.

  • Caché de OCI con Redis

    Oracle Cloud Infrastructure Cache with Redis es una solución de almacenamiento en caché completa y gestionada en memoria basada en Redis de código abierto. Este servicio totalmente gestionado acelera las lecturas y escrituras de datos, lo que mejora significativamente los tiempos de respuesta de las aplicaciones y el rendimiento de la base de datos para proporcionar una experiencia de cliente mejorada.

  • Servicio APEX

    Oracle APEX Application Development (APEX) es una plataforma de desarrollo con poco código que permite crear aplicaciones empresariales escalables, ricas en funciones y seguras que se pueden desplegar en cualquier lugar donde esté instalada Oracle Database. No tiene que ser experto en una amplia gama de tecnologías para crear soluciones sofisticadas. El servicio APEX incluye funciones integradas como los temas de la interfaz del usuario, los controles de navegación, los manejadores de formulario y los informes flexibles que aceleran el proceso de desarrollo de las aplicaciones.

  • Oracle Database 23 (búsqueda de vectores de IA)

    Oracle Database 23c ofrece la base de datos convergente más completa y sencilla para los desarrolladores que buscan crear nuevos microservicios, gráficos, documentos y datos relacionales. applications.Oracle ha anunciado el plan para agregar capacidades de búsqueda semántica mediante vectores de IA a Oracle Database 23c. La recopilación de funciones, denominada búsqueda vectorial de IA, incluye un nuevo tipo de datos vectoriales, índices vectoriales y operadores SQL de búsqueda vectorial que permiten a Oracle Database almacenar el contenido semántico de documentos, imágenes y otros datos no estructurados como vectores, y utilizarlos para ejecutar consultas de similitud rápidas. Para obtener más información, consulte el enlace Comunicado de prensa en la sección Explorar más.

  • Flujo

    Oracle Cloud Infrastructure Streaming proporciona una solución de almacenamiento duradera, escalable y totalmente gestionada para la ingesta de flujos de datos continuos y de alto volumen que puede utilizar y procesar en tiempo real. Puede utilizar Streaming para ingerir datos de gran volumen, como logs de aplicación, datos de telemetría operativa, datos de flujo de clics en la web, o para otros casos de uso en los que se producen y procesan datos de forma continua y secuencial en un modelo de mensajería de publicación-suscripción.

  • Eventos

    Los servicios de Oracle Cloud Infrastructure generan eventos, que son mensajes estructurados que describen los cambios en los recursos. Los eventos se emiten para operaciones de creación, lectura, actualización o supresión (CRUD), cambios de estado del ciclo de vida de los recursos y eventos del sistema que afectan a los recursos en la nube.

  • Functions

    Oracle Cloud Infrastructure Functions es una plataforma de funciones como servicio (FaaS) totalmente gestionada, multicliente, altamente escalable y bajo demanda. Está alimentado por el motor de origen abierto Fn Project. Las funciones le permiten desplegar el código y llamarlo directamente o dispararlo en respuesta a eventos. Oracle Functions utiliza contenedores de Docker alojados en Oracle Cloud Infrastructure Registry.

  • Gateway de API

    Oracle API Gateway le permite publicar API con puntos finales privados accesibles desde la red y que se pueden exponer a la red pública de Internet si es necesario. Los puntos finales admiten la validación de API, la transformación de solicitud y respuesta, CORS, la autenticación y autorización, y la limitación de solicitudes.

  • Firewall de aplicaciones web (WAF

    Oracle Cloud Infrastructure Web Application Firewall (WAF) es un servicio compatible con el sector de tarjetas de pago (PCI) basado en la región y de aplicación de perímetro que se asocia a un punto de aplicación, como un equilibrador de carga o un nombre de dominio de aplicación web. WAF protege las aplicaciones frente al tráfico de Internet malicioso y no deseado. WAF puede proteger cualquier punto final orientado a Internet, lo que proporciona un cumplimiento de reglas consistente en todas las aplicaciones de clientes.

  • Región

    Una región de Oracle Cloud Infrastructure es un área geográfica localizada que contiene uno o más centros de datos, denominados dominios de disponibilidad. Las regiones son independientes de otras regiones, y pueden separarse grandes distancias (entre países e incluso continentes).

  • Red virtual en la nube (VCN) y subred

    Una VCN es una red personalizable y definida por software que se configura en una región de Oracle Cloud Infrastructure. Al igual que las redes de los centros de datos tradicionales, las redes virtuales le proporcionan un control completo de su entorno de red. Una VCN puede tener varios bloques de CIDR no superpuestos que puede cambiar después de crear la VCN. Puede segmentar una VCN en subredes, las cuales se pueden acotar a una región o a un dominio de disponibilidad. Cada subred está formada por un rango contiguo de direcciones que no se solapan con las demás subredes de la VCN. Puede cambiar el tamaño de una subred después de la creación. Una subred puede ser pública o privada.

Recomendaciones

Utilice las siguientes recomendaciones como punto de partida. Es posible que sus requisitos difieran de la arquitectura que se describe aquí.
  • Mantenimiento y alta disponibilidad

    La arquitectura de referencia utiliza casi solo servicios PaaS gestionados por Oracle. No es necesario instalar, aplicar parches, actualizar ni actualizar el software con esta solución. Esto es válido para: Oracle Integration, OCI Generative AI, OCI Document Understanding, OCI Vision, Oracle Cloud Infrastructure Language, Oracle Cloud Infrastructure Data Science, OCI Object Storage, OCI Events, OCI Streaming, OCI Functions, OCI API Gateway, Oracle Cloud Infrastructure Web Application Firewall.

    El único componente que podría solicitar atención es Oracle Integration Connectivity Agent instalado en una instancia informática para acceder a recursos como el cluster OpenSearch de OCI, Autonomous Database, etc., que residen en una red privada. Siga las directrices de la documentación de Oracle Integration para que el agente de conectividad de Oracle Integration sea fácil de mantener y tenga alta disponibilidad.

  • Ampliación y tamaño

    Esta arquitectura de referencia utiliza los servicios PaaS y es escalable y lista para usar para la mayoría de los servicios que incluye. Tenga en cuenta que el cluster OpenSearch de OCI, así como el cluster OCI Cache with Redis, no se amplían ni reducen verticalmente automáticamente (solo manualmente). Por lo tanto, se necesita una escala correcta de la solución en función de su caso de uso.

  • Conectividad

    Todas las conexiones dentro de OCI se deben establecer a través de una red privada:

    • Puede utilizar la opción de puntos finales privados o los agentes de conectividad de Oracle Integration para conectarse a servicios OCI privados como OCI Streaming, Oracle Autonomous Database, Oracle Database, Oracle Database Cloud Service, etc.
    • Los agentes de conectividad de Oracle Integration que se conectan a servicios privados como el cluster OpenSearch de OCI, el cluster OCI Cache with Redis, etc. se deben instalar en una máquina virtual de OCI dentro de la misma subred privada donde se despliegan estos servicios.
    • Los flujos o temas de Kafka de flujo de OCI que cree se deben asociar a un pool de flujos desplegado con un punto final privado (asociado a una subred privada en una VCN de OCI). En el caso de flujos de Kafka privados de OCI Streaming o temas como los temas de resultados de extracción de documentos e imágenes (consulte el bloque lógico, Document, Image and Business Data Loader anterior) que reciben los metadatos de los archivos de resultados de extracción de OCI Document Understanding de OCI Events, puede aprovechar OCI Functions con OCI Events para entregar mensajes a puntos finales de transmisión privados.
    • Los agentes de conectividad que se conectan a servicios locales o en la nube de 3a parte (por ejemplo, bases de datos SQL de Azure) se deben instalar en una máquina virtual dentro de la misma subred privada donde se despliegan estos servicios externos.
  • Restricción del acceso a una instancia de Oracle Integration

    Restrinja las redes que tienen acceso a la instancia de Oracle Integration configurando la lista de permitidos de Oracle Integration (anteriormente una lista blanca). Solo los usuarios, los sistemas de las direcciones IP específicas, los bloques de enrutamiento entre dominios sin clase (CIDR) y las redes virtuales en la nube que especifique pueden acceder a la instancia de Oracle Integration.

    En esta arquitectura de referencia, Oracle Integration Allowlist podría restringir el acceso a la instancia de Oracle Integration, permitiendo solo solicitudes iniciadas por aplicaciones en la nube desplegadas en OCI, aplicaciones de Oracle SaaS, aplicaciones que no sean de Oracle Cloud, web local, Saas, aplicaciones en la nube y OCID de VCN asociados a las máquinas virtuales que alojan los agentes de conectividad de Oracle Integration.

Consideraciones

Tenga en cuenta los siguientes puntos al desplegar esta arquitectura de referencia.

  • Seguridad

    Los clusters de IA dedicados de OCI Generative AI son recursos informáticos que puede utilizar para ajustar modelos de LLM personalizados o para alojar puntos finales para modelos de LLM personalizados. Los clusters están dedicados a sus modelos y no se comparten con usuarios de otros arrendamientos. El uso de la IA generativa de OCI del modelo personalizado le permite acotar los modelos utilizando sus propios datos. De lo contrario, puede utilizar sus propios datos mediante la implantación de técnicas de generación aumentada de recuperación (RAG) que combinen embebido, indexación, etc. mediante modelos bajo demanda de IA generativa de OCI, almacenes de vectores (por ejemplo, búsqueda de vectores de OCI, búsqueda abierta, etc.) y mucho más.

    Utilice las políticas de Oracle Cloud Infrastructure Identity and Access Management (OCI IAM) para controlar quién puede acceder a sus recursos en la nube (por ejemplo, Oracle Integration, OCI Language, OCI Vision, servicio OCI Generative AI, OCI Streaming, instancias de OCI Compute, etc.) y qué operaciones se pueden realizar. Para proteger las contraseñas de la base de datos o cualquier otro secreto, considere el uso del servicio OCI Vault.

    Los documentos e imágenes se almacenan en cubos privados de OCI Object Storage. Se crea un enlace temporal con una vida corta cuando un usuario hace clic en el documento en la interfaz de usuario del motor de búsqueda de conocimientos. Utilice reglas y filtros de Oracle Cloud Infrastructure Web Application Firewall (WAF) para proteger los flujos de orquestación disparados por REST de Oracle Integration expuestos mediante OCI API Gateway frente a ataques maliciosos como ataques DDO, threads de inyección SQL, etc.

  • Posibilidades de ampliación

    Al crear flujos o temas de OCI Streaming, los administradores especifican el número de flujos que planean utilizar. Los flujos se pueden crear por dominio de negocio (por ejemplo, InvoiceStream, PurchaseOrderStream, etc.). Los administradores también especifican las particiones que planean utilizar por flujo o tema. Las particiones permiten distribuir un flujo, un tema mediante la división de mensajes en varios nodos, lo que permite que varios consumidores lean de un flujo, un tema en paralelo (en este caso, podría tener varias clonaciones del mismo flujo de integración de consumidor en Oracle Integration, cada una leyendo desde una partición diferente de un flujo o tema utilizando el adaptador de OCI Streaming como disparador).

    Al crear instancias de Oracle Integration, los administradores especifican el número de paquetes de mensajes que planean utilizar por instancia.

  • Límite de Recursos

    Tenga en cuenta las mejores prácticas, los límites por servicio y las cuotas de compartimento para su arrendamiento.

Agradecimientos

  • Author: Juan Carlos González Carrero
  • Contributors: Bob Peulen, Alexandru Negrea