Seleccionar IA con generación aumentada de recuperación (RAG)

Select AI with RAG aumenta su petición de datos de lenguaje natural al recuperar contenido de su almacén de vectores especificado mediante la búsqueda de similitud semántica. Esto reduce las alucinaciones al utilizar su contenido específico y actualizado y proporciona respuestas de lenguaje natural más relevantes a sus peticiones de datos.

Select AI automatiza el proceso de generación aumentada de recuperación (RAG). Esta técnica recupera datos de orígenes empresariales mediante la búsqueda vectorial de IA y aumenta las peticiones de datos de usuario para el modelo de lenguaje grande (LLM) especificado. Al aprovechar la información de los almacenes de datos empresariales, RAG reduce las alucinaciones y genera respuestas basadas en tierra.

RAG utiliza la búsqueda vectorial de IA en un índice vectorial para encontrar datos semánticamente similares para la pregunta especificada. El almacén de vectores procesa incrustaciones de vectores, que son representaciones matemáticas de varios puntos de datos como texto, imágenes y audio. Estas incrustaciones capturan el significado de los datos, lo que permite un procesamiento y análisis eficientes. Para obtener más información sobre las incrustaciones vectoriales y la búsqueda vectorial de IA, consulte Visión general de AI Vector Search.

Select AI se integra con la búsqueda vectorial de IA disponible en Oracle Autonomous Database 23ai para la búsqueda de similitudes mediante incrustaciones vectoriales.

Temas

Crea tu tienda de vectores

Select AI automatiza la creación y el relleno del almacén de vectores mediante la conversión de documentos de entrada (por ejemplo, PDF, DOC, JSON, XML o HTML) de su almacén de objetos a texto sin formato. Oracle Text soporta alrededor de 150 tipos de archivos. Para obtener una lista completa de todos los formatos de documento soportados, consulte Formatos de documento soportados.

Select AI procesa automáticamente documentos para fragmentar, genera incrustaciones, los almacena en el almacén de vectores especificado y actualiza el índice vectorial a medida que llegan nuevos datos.

A continuación, se muestra cómo se utiliza la entrada de Object Storage con Select AI RAG:

  1. Entrada: los datos se almacenan inicialmente en un almacenamiento de objetos.
  2. Oracle Autonomous Database recupera los datos de entrada o el documento, los fragmenta y envía los fragmentos a un modelo de embebido.
  3. El modelo de incrustación procesa los datos de fragmento y devuelve incrustaciones vectoriales.
  4. Las incrustaciones vectoriales se almacenan en un almacén de vectores para su uso con RAG. A medida que se agrega contenido, el índice vectorial se actualiza automáticamente.

RAG recupera información relevante de la base de datos empresarial para responder a la pregunta de un usuario. Esta información se proporciona al modelo de lenguaje grande especificado junto con la petición de datos del usuario. Select AI utiliza esta información empresarial adicional para mejorar la petición de datos y mejorar la respuesta del LLM. RAG puede mejorar la calidad de la respuesta con la información empresarial actualizada del almacén de vectores.



Seleccione AI implementa RAG de la siguiente manera:
  1. Entrada: el usuario hace una pregunta (especifica una petición de datos) mediante la acción Seleccionar AI narrate.

  2. Seleccione AI genera incrustaciones vectoriales de la petición de datos mediante el modelo de incrustación especificado en el perfil AI.

  3. El índice de búsqueda vectorial utiliza la inserción vectorial de la pregunta para encontrar contenido coincidente de los datos empresariales del cliente (buscando el almacén de vectores) que se ha indexado.

  4. La búsqueda vectorial devuelve los principales textos K similares a la entrada a la instancia de Autonomous Database.
  5. A continuación, Autonomous Database envía estos resultados de consulta K principales con la pregunta del usuario al LLM.
  6. El LLM devuelve su respuesta a su instancia de Autonomous Database.
  7. Autonomous Database Select AI proporciona la respuesta al usuario.

Uso de DBMS_CLOUD_AI para crear y gestionar índices vectoriales

Utilice el paquete DBMS_CLOUD_AI para crear y gestionar índices vectoriales y configurar parámetros JSON de base de datos vectorial.

Después de crear credenciales y proporcionar acceso de red a la base de datos vectorial y al proveedor de IA, la instancia de Autonomous Database utiliza perfiles de IA para configurar el acceso a los LLM. Consulte Ejemplo: configuración y uso de Select AI con RAG para obtener un ejemplo completo sobre cómo configurarlo y utilizarlo en sentencias Select AI.
Nota

Si no desea que los datos de tabla o los documentos de búsqueda vectorial se envíen a un LLM, un usuario con privilegios de administrador puede desactivar dicho acceso para todos los usuarios de la base de datos proporcionada. Esto, en efecto, desactiva la acción narrate para RAG.

Puede configurar perfiles de IA para los proveedores que se muestran en Seleccionar su proveedor de IA y LLM mediante el paquete DBMS_CLOUD_AI.

Consulte también:

Uso de modelos de transformadores en la base de datos

Select AI RAG le permite utilizar modelos de transformadores ONNX previamente entrenados que se importan a su base de datos en la instancia de Oracle Database 23ai para generar vectores de incrustación a partir de fragmentos de documentos y peticiones de datos de usuario.

Nota

Debe importar un modelo de transformador de formato ONNX previamente entrenado en la instancia de Oracle Database 23ai para utilizar Select AI RAG con un modelo de transformador en la base de datos importado. También puedes utilizar otros modelos de transformadores de proveedores de IA compatibles.

Consulte Ejemplo: selección de IA con modelos de transformadores en la base de datos para explorar la función.

Ventajas de Select AI RAG

Simplifica las consultas, mejora la precisión de las respuestas con los datos actuales y obtén transparencia revisando las fuentes utilizadas por el LLM.

Select AI RAG ofrece las siguientes ventajas:
  • Simplifica la consulta de datos y aumenta la precisión de las respuestas: permite a los usuarios consultar datos empresariales mediante lenguaje natural y proporciona a los LLM un contexto detallado a partir de datos empresariales para generar respuestas más precisas y relevantes, reduciendo las instancias de alucinaciones de LLM.

  • Información actualizada: proporcione a los LLM acceso a la información empresarial actual mediante almacenes de vectores, lo que elimina la necesidad de un ajuste costoso y laborioso de los LLM entrenados en conjuntos de datos estáticos.

  • Integración perfecta: integra con Oracle AI Vector Search para optimizar el manejo de datos y mejorar el rendimiento.

  • Orquestación de datos automatizada: automatiza los pasos de orquestación con un pipeline de Vector Index totalmente gestionado, lo que garantiza un procesamiento eficiente de los nuevos datos.

  • Resultados contextuales comprensibles: tiene acceso y recupera las fuentes utilizadas por el LLM de almacenes de vectores, lo que garantiza la transparencia y la confianza en los resultados. Permite ver y extraer datos en texto en lenguaje natural o formato JSON para facilitar la integración y el desarrollo de aplicaciones.