Selecionar IA com Geração Aumentada de Recuperação (RAG)

Selecionar AI com RAG aumenta o prompt de linguagem natural recuperando o conteúdo do armazenamento de vetores especificado usando a pesquisa de similaridade semântica. Isso reduz as alucinações usando seu conteúdo específico e atualizado e fornece respostas de linguagem natural mais relevantes aos seus prompts.

Selecione AI para automatizar o processo RAG (Recovery Augmented Generation, Geração aumentada de recuperação). Essa técnica recupera dados de origens empresariais usando a pesquisa de vetor AI e aumenta os prompts do usuário para seu modelo de linguagem grande (LLM) especificado. Ao aproveitar informações de armazenamentos de dados corporativos, a RAG reduz alucinações e gera respostas fundamentadas.

A RAG usa a pesquisa de vetor AI em um índice de vetor para encontrar dados semanticamente semelhantes para a pergunta especificada. O armazenamento de vetores processa incorporações de vetores, que são representações matemáticas de vários pontos de dados, como texto, imagens e áudio. Essas incorporações capturam o significado dos dados, permitindo processamento e análise eficientes. Para obter mais detalhes sobre incorporações de vetores e pesquisa de vetores de IA, consulte Visão Geral da Pesquisa de Vetores de IA.

A seleção de IA integra-se à pesquisa de vetor de IA disponível no Oracle Autonomous Database 23ai para pesquisa de similaridade usando incorporações de vetor.

Tópicos

Construa sua loja de vetores

O Select AI automatiza a criação e o preenchimento do armazenamento de vetores convertendo documentos de entrada (por exemplo, PDF, DOC, JSON, XML ou HTML) do armazenamento de objetos em texto simples. O Oracle Text suporta cerca de 150 tipos de arquivo. Para obter uma lista completa de todos os formatos de documento suportados, consulte Formatos de Documento Suportados.

A opção Selecionar AI processa automaticamente documentos em blocos, gera incorporações, armazena-os no armazenamento de vetores especificado e atualiza o índice de vetores à medida que novos dados chegam.

Veja como a entrada do Object Storage é usada com Select AI RAG:

  1. Entrada: Os dados são inicialmente armazenados em um Armazenamento de Objetos.
  2. O Oracle Autonomous Database recupera os dados de entrada ou o documento, os divide e envia os chunks para um modelo de incorporação.
  3. O modelo de incorporação processa os dados do bloco e retorna incorporações de vetores.
  4. As incorporações de vetores são então armazenadas em um armazenamento de vetores para uso com RAG. À medida que o conteúdo é adicionado, o índice do vetor é atualizado automaticamente.

A RAG recupera informações relevantes do banco de dados corporativo para responder à pergunta de um usuário. Essas informações são fornecidas ao modelo de idioma grande especificado junto com o prompt do usuário. Selecionar IA usa essas informações corporativas adicionais para aprimorar o prompt, melhorando a resposta do LLM. A RAG pode melhorar a qualidade da resposta com informações corporativas atualizadas do armazenamento de vetores.



Selecione AI implementa RAG da seguinte forma:
  1. Entrada: O usuário faz uma pergunta (especifica um prompt) usando a ação Selecionar AI narrate.

  2. Selecione AI para gerar incorporações de vetor do prompt usando o modelo de incorporação especificado no perfil AI.

  3. O índice de pesquisa vetorial usa a incorporação vetorial da pergunta para encontrar conteúdo correspondente dos dados empresariais do cliente (pesquisando o armazenamento de vetores) que foi indexado.

  4. A pesquisa de vetores retorna os principais textos K semelhantes à entrada da instância do Autonomous Database.
  5. Em seguida, o Autonomous Database envia esses principais resultados de consulta K com pergunta do usuário para o LLM.
  6. O LLM retorna sua resposta à sua instância do Autonomous Database.
  7. O Autonomous Database Select AI fornece a resposta ao usuário.

Use DBMS_CLOUD_AI para Criar e Gerenciar Índices de Vetores

Use o pacote DBMS_CLOUD_AI para criar e gerenciar índices vetoriais e configurar parâmetros JSON do banco de dados vetoriais.

Depois de criar credenciais e fornecer acesso de rede ao banco de dados vetorial e ao provedor de IA, sua instância do Autonomous Database usa perfis de IA para configurar o acesso aos LLMs. Consulte Exemplo: Configurar e Usar Selecionar AI com RAG para obter um exemplo completo sobre como configurá-lo e usá-lo nas instruções Selecionar AI.
Observação

Se você não quiser que os dados da tabela ou os documentos de pesquisa de vetores sejam enviados a um LLM, um usuário com privilégios de administrador poderá desativar esse acesso para todos os usuários do banco de dados fornecido. Isso, na verdade, desativa a ação narrate para RAG.

Você pode configurar perfis de IA para provedores listados em Selecione seu Provedor de IA e LLMs por meio do pacote DBMS_CLOUD_AI.

Consulte Também:

Usar Modelos de Transformador no Banco de Dados

Selecionar AI RAG permite que você use modelos de transformador ONNX pré-treinados que são importados para seu banco de dados na instância do Oracle Database 23ai para gerar vetores de incorporação de partes de documentos e prompts do usuário.

Observação

Importe um modelo de transformador de formato ONNX pré-treinado para a instância do Oracle Database 23ai para usar Selecionar RAG de IA com modelo de transformador importado no banco de dados. Você também pode usar outros modelos de transformadores de provedores de IA suportados.

Consulte Exemplo: Selecionar AI com Modelos de Transformador no Banco de Dados para explorar o recurso.

Benefícios do Select AI RAG

Simplifique a consulta, melhore a precisão da resposta com os dados atuais e obtenha transparência revisando as fontes usadas pelo LLM.

O Select AI RAG oferece os seguintes benefícios:
  • Simplifique a consulta de dados e aumente a precisão da resposta: permita que os usuários consultem dados corporativos usando linguagem natural e forneçam aos LLMs contexto detalhado de dados corporativos para gerar respostas mais precisas e relevantes, reduzindo instâncias de alucinações de LLM.

  • Informações atualizadas: Forneça aos LLMs acesso às informações corporativas atuais usando armazenamentos de vetores, eliminando a necessidade de ajuste fino caro e demorado de LLMs treinados em conjuntos de dados estáticos.

  • Integração perfeita: Integre com o Oracle AI Vector Search para tratamento de dados simplificado e desempenho aprimorado.

  • Orquestração automatizada de dados: Automatize as etapas de orquestração com um pipeline de Índice de Vetores totalmente gerenciado, garantindo o processamento eficiente de novos dados.

  • Resultados contextuais compreensíveis: Tem acesso e recupera as fontes utilizadas pelo LLM a partir de lojas de vetores, garantindo transparência e confiança nos resultados. Exibe e extrai dados em texto de linguagem natural ou formato JSON para facilitar a integração e o desenvolvimento de aplicativos.