Pesquisa de Vetor na Ferramenta de Análise de Dados

Você pode usar os recursos do Oracle AI Vector Search para procurar texto relevante de seus dados de origem em uma coluna específica.

A pesquisa de vetores ajuda a localizar e corresponder rapidamente dados semelhantes ao texto fornecido como entrada de pesquisa.

Pré-requisitos:

Para usar o recurso de pesquisa de vetores na ferramenta Análise de Dados, você precisa do seguinte:
  • Você deve ter o banco de dados 23ai com suporte a vetores.
  • As APIs REST do ORDS devem suportar o tipo de dados VECTOR.
  • Você deve usar a página Definições do Data Studio para selecionar a mesma credencial usada para pesquisa de vetores.
  • Os dados de origem já devem ter uma coluna não numérica para serem incorporados primeiro.
  • Para utilizar a Pesquisa de Vetor na ferramenta Análise de Dados, você deve ter:
    • Um serviço de conta OpenAI, Cohere ou An Azure OpenAI com crédito
    • Um acesso aos pacotes DBMS_VECTOR e DBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING.
    Observação

A ferramenta de Análise de Dados utiliza o pacote PL/SQL do Vector Utility DBMS_VECTOR e DBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING para fornecer as APIs REST de terceiros que permitem interagir com modelos de incorporação externos, como Cohere, Google AI, Hugging Face, Oracle Cloud Infrastructure (OCI) Generative AI, OpenAI ou Vertex AI. Você deve entender os termos do uso de modelos de incorporação de terceiros.

Observação

Certos recursos do banco de dados podem permitir que você acesse serviços oferecidos separadamente por terceiros, por exemplo, por meio do uso de especificações JSON que facilitam seu acesso a APIs REST.

Seu uso desses recursos é exclusivamente por sua conta e risco, e você é o único responsável por cumprir quaisquer termos e condições relacionados ao uso de tais serviços de terceiros. Não obstante quaisquer outros termos e condições relacionados aos serviços de terceiros, seu uso de tais recursos de banco de dados constitui sua aceitação desse risco e expressa exclusão da responsabilidade ou responsabilidade da Oracle por quaisquer danos resultantes de tal acesso.

Suponha que você seja um entusiasta de finanças e queira aprender sobre finanças por meio de notícias para obter um melhor senso de produtos e investimentos financeiros. Neste exemplo, você pode usar o recurso Pesquisa de Vetor para encontrar notícias relacionadas à palavra Bank.

Considere uma tabela que tenha as colunas CATEGORY, FILENAME, TITLE, CONTENT e outra coluna rotulada como VECTOR, que contenha a representação vetorial da coluna CONTENT. Como podemos usar a pesquisa vetorial em colunas de origem com dados não numéricos (imagem ou texto), qualquer coluna não numérica pode ser incorporada e armazenada como uma coluna vetorial. Mas neste exemplo, precisamos procurar texto relevante na coluna CONTENT.

Você pode usar a ferramenta Análise de Dados para executar a pesquisa de vetores.

Para indicar qual a incorporação da coluna é mantida na coluna do vetor, primeiro devemos mapear a coluna apropriada com o vetor apropriado usando a ferramenta Análise de Dados, procurar texto semelhante e, em seguida, executar a consulta. A guia Resultado da Consulta exibirá o conteúdo semelhante a Bank.

  1. Na ferramenta Análise de Dados, clique em + em Análises para criar uma nova Análise.
  2. Selecione o Esquema na lista drop-down Schema e a Consulta na lista drop-down Tipo.
  3. Selecione a tabela que você deseja consultar no browser de tabelas. Neste exemplo, você selecionará BBCNEWS_DATA_ENCODE.



  4. Informe a instrução Selecionar na área de edição Planilha SQL para recuperar todas as colunas da tabela BBCNEWS_DATA_ENCODE.

    Especifique o seguinte comando:
    Select * from BBCNEWS_DATA_ENCODE;
  5. Clique em Executar.



    Você pode exibir todas as colunas da tabela BBCNEWS_DATA_ENCODE na guia Resultados da Consulta.

  6. Selecione a exibição tabular do modo nos ícones que exibem vários modos de visualização do resultado da consulta.



  7. Arraste e solte a coluna CONTENT na área de soltura Coluna e clique nela para mapear a coluna de vetor.



  8. No assistente Mapear Coluna do Vetor, especifique os seguintes valores de campo:
    • Vetor de Mapa: Selecione na lista drop-down a coluna que consiste nas incorporações de vetor da coluna selecionada. Neste exemplo, é VETOR.
    • Selecionar Serviço: Selecione o serviço AI que você usará para utilizar esse recurso da ferramenta. Neste exemplo, é a OCI Generative AI.
    • Selecionar Credencial: Informe a credencial criada nas Definições do Data Studio para acessar o provedor de serviços de terceiros. Você precisa dessas credenciais para ativar o acesso durante as chamadas da API REST ao provedor de serviços de terceiros escolhido.
    • URL de IA generativa: Especifique o URL de IA generativa que você usará para chamar o provedor de serviços de terceiros, como Cohere, Google AI, Hugging Face, Oracle Cloud Infrastructure (OCI) Generative AI, OpenAI ou Vertex AI.
    • Selecionar Modelo: Especifique o modelo incorporado que você usará para gerar incorporações com base no texto. Neste exemplo, você informará cohere.embed-english-light-v2.0.

    Clique em Salvar para salvar o mapeamento. Selecione Limpar para limpar os valores de campo mencionados nesta etapa.

  9. Nos Filtros Facetados, você pode exibir a caixa de texto na coluna Conteúdo. Clique no sign-on + para expandir a caixa de texto.



  10. Digite o seguinte texto na caixa de texto para conteúdo semelhante à palavra Bank na coluna CONTENT:
    BANK

    Clique em Pesquisar.



  11. A guia Resultados da Consulta do painel Saída exibe a coluna de conteúdo que consiste no conteúdo relacionado a Bank.



    Você pode passar o mouse sobre cada conteúdo para exibir seu formulário expandido.