Búsqueda vectorial en la herramienta de análisis de datos

Puede utilizar las capacidades de búsqueda vectorial de Oracle AI para buscar texto relevante de los datos de origen en una columna específica.

La búsqueda vectorial ayuda a localizar y hacer coincidir rápidamente los datos que son similares al texto que proporciona como entrada de búsqueda.

Requisitos

Para utilizar la función de búsqueda vectorial en la herramienta Análisis de datos, necesita lo siguiente:
  • Debe tener una base de datos 23ai con soporte de vector.
  • Las API de REST de ORDS deben soportar el tipo de dato VECTOR.
  • Debe utilizar la página Configuración de Data Studio para seleccionar la misma credencial que utiliza para la búsqueda de vectores.
  • Los datos de origen ya deben tener una columna no numérica para embeber primero.
  • Para utilizar la búsqueda vectorial en la herramienta Análisis de datos, debe tener:
    • Un servicio de cuenta OpenAI, o Cohere o An Azure OpenAI con crédito
    • Acceso al paquete DBMS_VECTOR y DBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING.
    Nota

La herramienta de análisis de datos utiliza el paquete PL/SQL de Vector Utility DBMS_VECTOR y DBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING para proporcionar las API de REST de terceros que le permiten interactuar con modelos de incrustación externos como Cohere, Google AI, Hugging Face, Oracle Cloud Infrastructure (OCI) Generative AI, OpenAI o Vertex AI. Debe comprender los términos del uso de modelos de embebido de terceros.

Nota

Determinadas funciones de la base de datos pueden permitirle acceder a los servicios ofrecidos por terceros de forma independiente, por ejemplo, mediante el uso de especificaciones JSON que faciliten su acceso a las API de REST.

Su uso de estas funciones es bajo su propio riesgo, y usted es el único responsable de cumplir con los términos y condiciones relacionados con el uso de dichos servicios de terceros. Independientemente de cualesquiera otros términos y condiciones relacionados con los servicios de terceros, el uso que Vd. haga de dichas funciones de la base de datos constituye la aceptación por su parte de ese riesgo y la exclusión expresa de la responsabilidad o responsabilidad de Oracle por cualesquiera daños resultantes de dicho acceso.

Supongamos que eres un entusiasta de las finanzas y quieres aprender sobre las finanzas a través de noticias para obtener un mejor sentido de los productos financieros y las inversiones. En este ejemplo, puede utilizar la función de búsqueda vectorial para buscar noticias relacionadas con la palabra Bank.

Considere una tabla que tenga las columnas CATEGORY, FILENAME, TITLE, CONTENT y una columna diferente con la etiqueta VECTOR, que contenga la representación vectorial de la columna CONTENT. Dado que podemos utilizar la búsqueda vectorial en columnas de origen con datos no numéricos (imagen o texto), cualquiera de las columnas no numéricas se puede incrustar y almacenar como una columna vectorial. Sin embargo, en este ejemplo, necesitamos buscar texto relevante de la columna CONTENT.

Puede utilizar la herramienta Análisis de datos para realizar una búsqueda vectorial.

Para indicar qué incrustación de columna se mantiene en la columna vectorial, primero debemos asignar la columna adecuada con el vector adecuado mediante la herramienta Análisis de datos, buscar texto similar y, a continuación, ejecutar la consulta. El separador Query Result mostrará el contenido similar a Bank.

  1. En la herramienta Análisis de datos, haga clic en + en Análisis para crear un nuevo análisis.
  2. Seleccione el esquema en la lista desplegable Esquema y la consulta en la lista desplegable Tipo.
  3. Seleccione la tabla que desea consultar en el explorador de tablas. En este ejemplo, seleccionará BBCNEWS_DATA_ENCODE.



  4. Introduzca la sentencia Select en el área de edición SQL Worksheet para recuperar todas las columnas de la tabla BBCNEWS_DATA_ENCODE.

    Especifique el siguiente comando:
    Select * from BBCNEWS_DATA_ENCODE;
  5. Haga clic en Ejecutar.



    Puede ver todas las columnas de la tabla BBCNEWS_DATA_ENCODE en el separador Resultados de la consulta.

  6. Seleccione la vista tabular del modo en los iconos que muestran varios modos de visualización del resultado de la consulta.



  7. Arrastre y suelte la columna CONTENT en el área de colocación Column y haga clic en ella para asignar la columna vectorial.



  8. En el asistente Map Vector Column, especifique los siguientes valores de campo:
    • Vector de mapa: seleccione la columna que consta de incrustaciones de vector de la columna seleccionada en la lista desplegable. En este ejemplo, se trata de VECTOR.
    • Seleccionar servicio: seleccione el servicio AI que utilizará para utilizar esta función de la herramienta. En este ejemplo, se trata de OCI Generative AI.
    • Seleccionar credencial: introduzca la credencial que crea desde la configuración de Data Studio para acceder al proveedor de servicios de terceros. Necesita estas credenciales para activar el acceso durante las llamadas de la API de REST al proveedor de servicios de terceros seleccionado.
    • URL de IA generativa: especifique la URL de IA generativa que utilizará para llamar al proveedor de servicios de terceros, como Cohere, Google AI, Hugging Face, Oracle Cloud Infrastructure (OCI) Generative AI, OpenAI o Vertex AI.
    • Seleccionar modelo: especifique el modelo embebido que utilizará para generar embebidas a partir del texto. En este ejemplo, introducirá cohere.embed-english-light-v2.0.

    Haga clic en Guardar para guardar la asignación. Seleccione Borrar para borrar los valores de campo que menciona en este paso.

  9. En los filtros por facetas, puede ver el cuadro de texto debajo de la columna Contenido. Haga clic en el inicio de sesión + para expandir el cuadro de texto.



  10. Introduzca el siguiente texto en el cuadro de texto al contenido similar a la palabra Bank en la columna CONTENT:
    BANK

    Haga clic en Buscar.



  11. El separador Resultados de la Consulta del panel Salida muestra la columna de contenido que consta de contenido relacionado con Bank.



    Puede pasar el mouse sobre cada contenido para ver su formulario ampliado.