Vector Search na Ferramenta de Análise de Dados
Você pode usar os recursos do Oracle AI Vector Search para procurar texto relevante de seus dados de origem em uma coluna específica.
A pesquisa de vetores ajuda a localizar e corresponder rapidamente dados semelhantes ao texto que você fornece como entrada de pesquisa.
Pré-requisitos
- Você deve ter o 23ai Database com suporte Vector.
- As APIs REST do ORDS devem suportar o tipo de dados VECTOR.
- Use a página Definições do Data Studio para selecionar a mesma credencial usada para pesquisa de vetor.
- Os dados de origem já devem ter uma coluna não numérica para serem incorporados primeiro.
- Para utilizar a Pesquisa de Vetores na ferramenta Análise de Dados, você deve ter:
- Um serviço de conta OpenAI, Cohere ou Azure OpenAI com crédito
- Um acesso ao pacote
DBMS_VECTOR
eDBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING
.
Observação
- Você deve definir seu perfil AI. Siga as etapas mencionadas neste capítulo para Usar Selecionar AI para Gerar SQL de Prompts de Linguagem Natural.
- Depois de criar e configurar seu perfil do AI, defina seu perfil do AI no assistente Definições do Data Studio no menu de navegação do Data Studio para usar recursos do AI, como gerar SQL de Linguagem Natural e Vector Search na ferramenta Data Studio.
A ferramenta Data Analysis utiliza o pacote DBMS_VECTOR
e DBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING
do Vector Utility PL/SQL para fornecer as APIs REST de terceiros que permitem interagir com modelos de incorporação externos, como Cohere, Google AI, Hugging Face, Oracle Cloud Infrastructure (OCI) Generative AI, OpenAI ou Vertex AI. Você deve entender os termos de uso de modelos de incorporação de terceiros.
Alguns recursos do banco de dados podem permitir que você acesse serviços oferecidos separadamente por terceiros, por exemplo, por meio do uso de especificações JSON que facilitam seu acesso a APIs REST.
O seu uso destes recursos é exclusivamente por sua conta e risco, e você é o único responsável por cumprir quaisquer termos e condições relacionados ao uso de tais serviços de terceiros. Não obstante quaisquer outros termos e condições relacionados aos serviços de terceiros, seu uso de tais recursos do banco de dados constitui sua aceitação desse risco e expressa a exclusão da responsabilidade ou responsabilidade da Oracle por quaisquer danos resultantes de tal acesso.
Suponha que você seja um entusiasta de finanças e queira aprender sobre finanças por meio de notícias para obter um melhor senso de produtos e investimentos financeiros. Neste exemplo, você pode usar o recurso Pesquisa de Vetores para encontrar notícias relacionadas à palavra Bank
.
Considere uma tabela que tenha as colunas CATEGORY
, FILENAME
, TITLE
, CONTENT
e outra coluna com o rótulo VECTOR
, que contenha a representação vetorial da coluna CONTENT
. Como podemos usar a pesquisa vetorial em colunas de origem com dados não numéricos (imagem ou texto), qualquer coluna não numérica pode ser incorporada e armazenada como uma coluna vetorial. Mas neste exemplo, precisamos procurar texto relevante na coluna CONTENT
.
Você pode usar a ferramenta Análise de Dados para executar a pesquisa vetorial.
Para indicar qual incorporação de coluna é mantida na coluna de vetor, primeiro devemos mapear a coluna apropriada com o vetor apropriado usando a ferramenta Análise de Dados, procurar texto semelhante e, em seguida, executar a consulta. A guia Resultado da Consulta exibirá o conteúdo semelhante a Bank
.
- Na ferramenta Análise de Dados, clique em + em Análises para criar uma nova Análise.
- Na lista drop-down Esquema, selecione Schema e Query na lista drop-down Tipo.
- Selecione a tabela que deseja consultar no navegador de tabelas. Neste exemplo, você selecionará
BBCNEWS_DATA_ENCODE
. -
Informe a instrução Select na área de edição da Planilha SQL para recuperar todas as colunas da tabela
BBCNEWS_DATA_ENCODE
.Especifique o seguinte comando:Select * from BBCNEWS_DATA_ENCODE;
- Clique em Executar.
Você pode exibir todas as colunas da tabela
BBCNEWS_DATA_ENCODE
na guia Resultados da Consulta. - Selecione a view tabular do modo nos ícones que exibem vários modos de visualização do resultado da consulta.
- Arraste e solte a coluna
CONTENT
na área de soltura Coluna e clique nela para mapear a coluna do vetor. - No assistente Mapear Coluna de Vetor, especifique os seguintes valores de campo:
- Vetor de Mapa: Selecione a coluna que consiste nas incorporações de vetor da coluna selecionada na lista drop-down. Neste exemplo, é VECTOR.
- Selecionar Serviço: Selecione o serviço de IA que você usará para utilizar esse recurso da ferramenta. Neste exemplo, é o OCI Generative AI.
- Selecionar Credencial: Informe a credencial criada nas Definições do Data Studio para acessar o provedor de serviços de terceiros. Você precisa dessas credenciais para ativar o acesso durante as chamadas de API REST ao seu provedor de serviços de terceiros escolhido.
- URL da IA Generativa: Especifique o URL da IA Generativa que você usará para chamar o provedor de serviços terceirizado, como Cohere, Google AI, Hugging Face, Oracle Cloud Infrastructure (OCI) Generative AI, OpenAI ou Vertex AI.
- Selecionar Modelo: Especifique o modelo de incorporação que você usará para gerar incorporações do texto. Neste exemplo, você digitará cohere.embed-english-light-v2.0.
Clique em Salvar para salvar o mapeamento. Selecione Limpar para limpar os valores de campo mencionados nesta etapa.
- Nos Filtros com faceta, é possível visualizar a caixa de texto na coluna Conteúdo. Clique no sinal + para expandir a caixa de texto.
- Informe o seguinte texto na caixa de texto para conteúdo semelhante à palavra
Bank
na colunaCONTENT
:BANK
Clique em Pesquisar.
- A guia Resultados da Consulta do painel Saída exibe a coluna de conteúdo que consiste em conteúdo relacionado ao
Bank
.Você pode passar o mouse sobre cada conteúdo para exibir seu formulário expandido.
Tópico principal: A Ferramenta de Análise de Dados