Vector Search na Ferramenta de Análise de Dados

Você pode usar os recursos do Oracle AI Vector Search para procurar texto relevante de seus dados de origem em uma coluna específica.

A pesquisa de vetores ajuda a localizar e corresponder rapidamente dados semelhantes ao texto que você fornece como entrada de pesquisa.

Pré-requisitos

Para usar o recurso de pesquisa vetorial na ferramenta Análise de Dados, você precisa do seguinte:
  • Você deve ter o 23ai Database com suporte Vector.
  • As APIs REST do ORDS devem suportar o tipo de dados VECTOR.
  • Use a página Definições do Data Studio para selecionar a mesma credencial usada para pesquisa de vetor.
  • Os dados de origem já devem ter uma coluna não numérica para serem incorporados primeiro.
  • Para utilizar a Pesquisa de Vetores na ferramenta Análise de Dados, você deve ter:
    • Um serviço de conta OpenAI, Cohere ou Azure OpenAI com crédito
    • Um acesso ao pacote DBMS_VECTOR e DBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING.
    Observação

A ferramenta Data Analysis utiliza o pacote DBMS_VECTOR e DBMS_VECTOR_CHAIN.UTL_TO_EMBEDDING do Vector Utility PL/SQL para fornecer as APIs REST de terceiros que permitem interagir com modelos de incorporação externos, como Cohere, Google AI, Hugging Face, Oracle Cloud Infrastructure (OCI) Generative AI, OpenAI ou Vertex AI. Você deve entender os termos de uso de modelos de incorporação de terceiros.

Observação

Alguns recursos do banco de dados podem permitir que você acesse serviços oferecidos separadamente por terceiros, por exemplo, por meio do uso de especificações JSON que facilitam seu acesso a APIs REST.

O seu uso destes recursos é exclusivamente por sua conta e risco, e você é o único responsável por cumprir quaisquer termos e condições relacionados ao uso de tais serviços de terceiros. Não obstante quaisquer outros termos e condições relacionados aos serviços de terceiros, seu uso de tais recursos do banco de dados constitui sua aceitação desse risco e expressa a exclusão da responsabilidade ou responsabilidade da Oracle por quaisquer danos resultantes de tal acesso.

Suponha que você seja um entusiasta de finanças e queira aprender sobre finanças por meio de notícias para obter um melhor senso de produtos e investimentos financeiros. Neste exemplo, você pode usar o recurso Pesquisa de Vetores para encontrar notícias relacionadas à palavra Bank.

Considere uma tabela que tenha as colunas CATEGORY, FILENAME, TITLE, CONTENT e outra coluna com o rótulo VECTOR, que contenha a representação vetorial da coluna CONTENT. Como podemos usar a pesquisa vetorial em colunas de origem com dados não numéricos (imagem ou texto), qualquer coluna não numérica pode ser incorporada e armazenada como uma coluna vetorial. Mas neste exemplo, precisamos procurar texto relevante na coluna CONTENT.

Você pode usar a ferramenta Análise de Dados para executar a pesquisa vetorial.

Para indicar qual incorporação de coluna é mantida na coluna de vetor, primeiro devemos mapear a coluna apropriada com o vetor apropriado usando a ferramenta Análise de Dados, procurar texto semelhante e, em seguida, executar a consulta. A guia Resultado da Consulta exibirá o conteúdo semelhante a Bank.

  1. Na ferramenta Análise de Dados, clique em + em Análises para criar uma nova Análise.
  2. Na lista drop-down Esquema, selecione Schema e Query na lista drop-down Tipo.
  3. Selecione a tabela que deseja consultar no navegador de tabelas. Neste exemplo, você selecionará BBCNEWS_DATA_ENCODE.



  4. Informe a instrução Select na área de edição da Planilha SQL para recuperar todas as colunas da tabela BBCNEWS_DATA_ENCODE.

    Especifique o seguinte comando:
    Select * from BBCNEWS_DATA_ENCODE;
  5. Clique em Executar.



    Você pode exibir todas as colunas da tabela BBCNEWS_DATA_ENCODE na guia Resultados da Consulta.

  6. Selecione a view tabular do modo nos ícones que exibem vários modos de visualização do resultado da consulta.



  7. Arraste e solte a coluna CONTENT na área de soltura Coluna e clique nela para mapear a coluna do vetor.



  8. No assistente Mapear Coluna de Vetor, especifique os seguintes valores de campo:
    • Vetor de Mapa: Selecione a coluna que consiste nas incorporações de vetor da coluna selecionada na lista drop-down. Neste exemplo, é VECTOR.
    • Selecionar Serviço: Selecione o serviço de IA que você usará para utilizar esse recurso da ferramenta. Neste exemplo, é o OCI Generative AI.
    • Selecionar Credencial: Informe a credencial criada nas Definições do Data Studio para acessar o provedor de serviços de terceiros. Você precisa dessas credenciais para ativar o acesso durante as chamadas de API REST ao seu provedor de serviços de terceiros escolhido.
    • URL da IA Generativa: Especifique o URL da IA Generativa que você usará para chamar o provedor de serviços terceirizado, como Cohere, Google AI, Hugging Face, Oracle Cloud Infrastructure (OCI) Generative AI, OpenAI ou Vertex AI.
    • Selecionar Modelo: Especifique o modelo de incorporação que você usará para gerar incorporações do texto. Neste exemplo, você digitará cohere.embed-english-light-v2.0.

    Clique em Salvar para salvar o mapeamento. Selecione Limpar para limpar os valores de campo mencionados nesta etapa.

  9. Nos Filtros com faceta, é possível visualizar a caixa de texto na coluna Conteúdo. Clique no sinal + para expandir a caixa de texto.



  10. Informe o seguinte texto na caixa de texto para conteúdo semelhante à palavra Bank na coluna CONTENT:
    BANK

    Clique em Pesquisar.



  11. A guia Resultados da Consulta do painel Saída exibe a coluna de conteúdo que consiste em conteúdo relacionado ao Bank.



    Você pode passar o mouse sobre cada conteúdo para exibir seu formulário expandido.