Búsqueda vectorial en la herramienta de análisis de datos
Puede utilizar las capacidades de Oracle AI Vector Search para buscar texto relevante de los datos de origen en una columna específica.
La búsqueda vectorial ayuda a localizar y hacer coincidir rápidamente datos que son similares al texto que proporciona como entrada de búsqueda.
Requisitos
- Debe tener una base de datos 23ai con soporte de Vector.
- Las API de REST de ORDS deben soportar el tipo de dato VECTOR.
- Debe utilizar la página Valores de Data Studio para seleccionar la misma credencial que utiliza para la búsqueda de vectores.
- Los datos de origen ya deben tener una columna no numérica para embeberlos primero.
- Para utilizar la búsqueda vectorial en la herramienta de análisis de datos, debe tener:
- Un servicio de cuenta OpenAI, o Cohere o An Azure OpenAI con crédito
- Acceso al paquete
DBMS_VECTOR
yDBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING
.
Nota
- Debe definir su perfil de IA. Siga los pasos mencionados en este capítulo para Utilizar Seleccionar IA para generar SQL a partir de peticiones de datos de lenguaje natural.
- Después de crear y configurar el perfil de AI, defina el perfil de AI en el asistente Configuración de Data Studio del menú de navegación de Data Studio para utilizar funciones de AI como la generación de SQL a partir de lenguaje natural y la búsqueda vectorial en la herramienta Data Studio.
La herramienta de análisis de datos utiliza el paquete PL/SQL de la utilidad vectorial DBMS_VECTOR
y DBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING
para proporcionar las API de REST de terceros que le permiten interactuar con modelos de integración externos como Cohere, Google AI, Hugging Face, Oracle Cloud Infrastructure (OCI) Generative AI, OpenAI o Vertex AI. Debe comprender las condiciones de uso de modelos de incrustación de terceros.
Ciertas funciones de la base de datos pueden permitirle acceder a los servicios ofrecidos por separado por terceros, por ejemplo, mediante el uso de especificaciones JSON que facilitan su acceso a las API de REST.
Su uso de estas funciones es bajo su propio riesgo, y usted es el único responsable de cumplir con los términos y condiciones relacionados con el uso de dichos servicios de terceros. Independientemente de lo que se especifique en otros términos y condiciones relacionados con los Servicios de terceros, el uso que Vd. haga de dichas funciones de la base de datos constituye la aceptación por parte de Vd. de ese riesgo y la exclusión expresa de la responsabilidad o responsabilidad de Oracle por cualesquiera daños derivados de dicho acceso.
Supongamos que eres un entusiasta de las finanzas y quieres aprender sobre las finanzas a través de las noticias para obtener un mejor sentido de los productos financieros y las inversiones. En este ejemplo, puede utilizar la función Búsqueda vectorial para buscar noticias relacionadas con la palabra Bank
.
Considere una tabla que tenga las columnas CATEGORY
, FILENAME
, TITLE
, CONTENT
y una columna diferente con la etiqueta VECTOR
, que contenga la representación vectorial de la columna CONTENT
. Ya que podemos utilizar la búsqueda vectorial en columnas de origen con datos no numéricos (imagen o texto), cualquiera de las columnas no numéricas se puede incrustar y almacenar como una columna vectorial. Sin embargo, en este ejemplo, debemos buscar texto relevante de la columna CONTENT
.
Puede utilizar la herramienta Análisis de datos para realizar búsquedas vectoriales.
Para indicar qué incrustación de columna se mantiene en la columna vectorial, primero debemos asignar la columna adecuada con el vector adecuado mediante la herramienta Análisis de datos, buscar texto similar y, a continuación, ejecutar la consulta. El separador Resultado de Consulta mostrará el contenido similar a Bank
.
- En la herramienta Análisis de datos, haga clic en + en Análisis para crear un nuevo análisis.
- Seleccione el esquema en la lista desplegable Esquema y la consulta en la lista desplegable Tipo.
- Seleccione la tabla que desea consultar en el explorador de tablas. En este ejemplo, seleccionará
BBCNEWS_DATA_ENCODE
. -
Introduzca la sentencia Select en el área de edición de hoja de trabajo de SQL para recuperar todas las columnas de la tabla
BBCNEWS_DATA_ENCODE
.Especifique el siguiente comando:Select * from BBCNEWS_DATA_ENCODE;
- Haga clic en Ejecutar.
Puede ver todas las columnas de la tabla
BBCNEWS_DATA_ENCODE
en el separador Resultados de la consulta. - Seleccione la vista tabular del modo en los iconos que muestran varios modos de visualización del resultado de la consulta.
- Arrastre y suelte la columna
CONTENT
en el área de colocación Column y haga clic en ella para asignar la columna vectorial. - En el asistente Map Vector Column, especifique los siguientes valores de campo:
- Vector de mapa: seleccione la columna que consta de las incrustaciones de vectores de la columna seleccionada en la lista desplegable. En este ejemplo, es VECTOR.
- Seleccionar servicio: seleccione el servicio AI que utilizará para utilizar esta función de la herramienta. En este ejemplo, es OCI Generative AI.
- Seleccionar credencial: introduzca la credencial que crea a partir de la configuración de Data Studio para acceder al proveedor de servicios de terceros. Necesita estas credenciales para activar el acceso durante las llamadas de API de REST al proveedor de servicios de terceros elegido.
- URL de IA generativa: especifique la URL de IA generativa que utilizará para llamar al proveedor de servicios de terceros, como Cohere, Google AI, Hugging Face, Oracle Cloud Infrastructure (OCI) Generative AI, OpenAI o Vertex AI.
- Seleccionar modelo: especifique el modelo de embebido que utilizará para generar embebidos a partir del texto. En este ejemplo, introducirá cohere.embed-english-light-v2.0.
Para guardar la asignación, haga clic en Guardar. Seleccione Borrar para borrar los valores de campo que menciona en este paso.
- En Filtros facetados, puede ver el cuadro de texto debajo de la columna Contenido. Haga clic en el signo + para ampliar el cuadro de texto.
- Introduzca el siguiente texto en el cuadro de texto para contenido similar a la palabra
Bank
en la columnaCONTENT
:BANK
Haga clic en Buscar.
- El separador Resultados de Consulta del panel Salida muestra la columna de contenido que consta de contenido relacionado con
Bank
.Puede pasar el mouse sobre cada contenido para ver su formulario expandido.
Tema principal: Herramienta de análisis de datos