Seleccionar IA con generación aumentada de recuperación (RAG)

Select AI with RAG aumenta su petición de datos en lenguaje natural mediante la recuperación de contenido del almacén de vectores especificado mediante la búsqueda de similitud semántica. Esto reduce las alucinaciones mediante el uso de su contenido específico y actualizado y proporciona respuestas de lenguaje natural más relevantes a sus peticiones de datos.

Seleccione AI para automatizar el proceso de generación aumentada de recuperación (RAG). Esta técnica recupera datos de orígenes empresariales mediante la búsqueda vectorial de IA y aumenta las peticiones de datos de usuario para el modelo de lenguaje grande (LLM) especificado. Al aprovechar la información de los almacenes de datos empresariales, RAG reduce las alucinaciones y genera respuestas basadas en tierra.

RAG utiliza la búsqueda vectorial de IA en un índice vectorial para encontrar datos semánticamente similares para la pregunta especificada. El almacén de vectores procesa incrustaciones de vectores, que son representaciones matemáticas de varios puntos de datos como texto, imágenes y audio. Estas incrustaciones capturan el significado de los datos, lo que permite un procesamiento y análisis eficientes. Para obtener más información sobre las incrustaciones de vectores y la búsqueda de vectores de IA, consulte Visión general de la búsqueda vectorial de IA.

Select AI se integra con la búsqueda de vectores de IA disponible en Oracle Autonomous Database 23ai para la búsqueda de similitud mediante incrustaciones de vectores.

Temas

Construye tu tienda de vectores

Select AI automatiza la creación y el relleno del almacén de vectores mediante la conversión de documentos de entrada (por ejemplo, PDF, DOC, JSON, XML o HTML) del almacén de objetos en texto sin formato. Oracle Text soporta alrededor de 150 tipos de archivos. Para obtener una lista completa de todos los formatos de documento soportados, consulte Formatos de documento soportados.

Seleccionar AI procesa automáticamente los documentos en fragmentos, genera incrustaciones, los almacena en el almacén de vectores especificado y actualiza el índice de vectores a medida que llegan nuevos datos.

A continuación, se muestra cómo se utiliza la entrada de Object Storage con la RAG Select AI:

  1. Entrada: los datos se almacenan inicialmente en Object Storage.
  2. Oracle Autonomous Database recupera los datos de entrada o el documento, los fragmenta y envía los fragmentos a un modelo de embebido.
  3. El modelo de incrustación procesa los datos de fragmento y devuelve incrustaciones de vectores.
  4. Las incrustaciones de vectores se almacenan en un almacén de vectores para su uso con RAG. A medida que se agrega contenido, el índice vectorial se actualiza automáticamente.

RAG recupera información relevante de la base de datos empresarial para responder a la pregunta de un usuario. Esta información se proporciona al modelo de lenguaje grande especificado junto con la petición de datos de usuario. Select AI utiliza esta información empresarial adicional para mejorar la petición de datos y mejorar la respuesta del LLM. RAG puede mejorar la calidad de respuesta con información empresarial actualizada del almacén de vectores.



Seleccione AI implementa RAG de la siguiente manera:
  1. Entrada: el usuario hace una pregunta (especifica una petición de datos) mediante la acción Seleccionar IA narrate.

  2. Seleccione AI para generar incrustaciones de vectores de la petición de datos mediante el modelo de incrustación especificado en el perfil AI.

  3. El índice de búsqueda vectorial utiliza la incrustación vectorial de la pregunta para encontrar contenido coincidente a partir de los datos empresariales del cliente (buscando el almacén de vectores) que se ha indexado.

  4. La búsqueda vectorial devuelve los textos K principales similares a la entrada a la instancia de Autonomous Database.
  5. A continuación, Autonomous Database envía estos resultados de consulta K principales con una pregunta del usuario al LLM.
  6. El LLM devuelve su respuesta a la instancia de Autonomous Database.
  7. Autonomous Database Select AI proporciona la respuesta al usuario.

Uso de DBMS_CLOUD_AI para crear y gestionar índices vectoriales

Utilice el paquete DBMS_CLOUD_AI para crear y gestionar índices vectoriales y configurar parámetros JSON de base de datos vectorial.

Después de crear credenciales y proporcionar acceso de red a la base de datos vectorial y al proveedor de IA, la instancia de Autonomous Database utiliza perfiles de IA para configurar el acceso a los LLM. Consulte Example: Set Up and Use Select AI with RAG para obtener un ejemplo completo sobre su configuración y uso en sentencias Select AI.
Nota

Si no desea que los datos de tabla o los documentos de búsqueda vectorial se envíen a un LLM, un usuario con privilegios de administrador puede desactivar dicho acceso para todos los usuarios de la base de datos determinada. De hecho, desactiva la acción narrate para RAG.

Puede configurar perfiles de AI para los proveedores que se muestran en Select your AI Provider and LLMs mediante el paquete DBMS_CLOUD_AI.

Consulte también:

Uso de Modelos de Transformador en la Base de Datos

Select AI RAG permite utilizar modelos de transformadores ONNX previamente entrenados que se importan a la base de datos en la instancia de Oracle Database 23ai para generar vectores de embebido a partir de fragmentos de documentos y peticiones de datos de usuario.

Nota

Debe importar un modelo de transformador de formato ONNX previamente entrenado en la instancia de Oracle Database 23ai para utilizar Select AI RAG con un modelo de transformador importado en la base de datos. También puede utilizar otros modelos de transformadores de proveedores de IA compatibles.

Consulte Example: Select AI with In-database Transformer Models para explorar la función.

Ventajas de Select AI RAG

Simplifique las consultas, mejore la precisión de la respuesta con datos actuales y aumente la transparencia mediante la revisión de las fuentes utilizadas por el LLM.

Select AI RAG ofrece las siguientes ventajas:
  • Simplifique la consulta de datos y aumente la precisión de la respuesta: permita a los usuarios consultar datos empresariales mediante lenguaje natural y proporcione a los LLM contexto detallado a partir de datos empresariales para generar respuestas más precisas y relevantes, lo que reduce las instancias de alucinaciones de LLM.

  • Información actualizada: proporcione a los LLM acceso a la información empresarial actual mediante almacenes vectoriales, lo que elimina la necesidad de un ajuste fino costoso y laborioso de LLM entrenados en juegos de datos estáticos.

  • Integración perfecta: integra con Oracle AI Vector Search para una gestión de datos optimizada y un rendimiento mejorado.

  • Orquestación de datos automatizada: automatice los pasos de orquestación con un pipeline de Vector Index totalmente gestionado, lo que garantiza un procesamiento eficiente de los nuevos datos.

  • Resultados contextuales comprensibles: tiene acceso y recupera las fuentes utilizadas por el LLM de los almacenes vectoriales, lo que garantiza la transparencia y la confianza en los resultados. Permite ver y extraer datos en texto en lenguaje natural o en formato JSON para facilitar la integración y el desarrollo de aplicaciones.