Bases de Conhecimento

As bases de conhecimento utilizam o recurso Oracle Database 26ai Vector Search para armazenar incorporações de vetores de documentos armazenados no AI Data Platform Workbench.

Por meio dos recursos de pesquisa vetorial do Oracle Database 26ai, as bases de conhecimento capacitam os agentes de IA a realizar pesquisas semânticas e recuperar documentos semanticamente relevantes. No AI Data Platform Workbench, as bases de conhecimento são criadas em um esquema de um catálogo no tipo Bases de Conhecimento.


Página Catálogo Mestre do AI Data Platform Workbench aberta com um catálogo selecionado e Bases de Conhecimento destacadas

No AI Data Platform Workbench, as bases de conhecimento são criadas em esquemas de catálogos padrão usando o tipo de Base de Conhecimento. A ingestão de arquivos PDF, DOCX e TXT armazenados em volumes gerenciados ou externos é suportada em bases de conhecimento. Por padrão, os vetores são armazenados na instância do Oracle Database 26ai Vector Search que é provisionada na sua tenancy quando sua instância da AI Data Platform é criada.

O AI Data Platform Workbench suporta dois modelos de incorporação:
  • ALL_MINILM_L12_V2: Um modelo de transformadores de frases que mapeia frases e parágrafos para um espaço vetorial denso de 384 dimensões. Usado para tarefas como clustering ou pesquisa semântica.
  • MULTILINGUAL_E5_SMALL: Gera incorporações de vetores para texto em vários idiomas. Seu design compacto permite um desempenho eficaz em vários idiomas, adequado para diversos conjuntos de dados e cenários multilíngues.

Observação:

Por si só, um objeto da base de conhecimento no AI Data Platform Workbench não pode ser consultado diretamente. Você consulta uma base de conhecimento criando uma ferramenta RAG anexada a um agente em um fluxo de agente e selecionando a base de conhecimento relevante. Para obter mais informações sobre ferramentas RAG, consulte Ferramenta RAG. Para obter mais informações sobre Agentes de IA, consulte Agentes de IA.

Ingestão de Origens de Dados

Depois de criar uma base de conhecimento no AI Data Platform Workbench, você precisa acessar essa base de conhecimento e especificar uma origem de dados da qual ingerir dados. Você pode selecionar um volume inteiro ou uma pasta em um volume como origem para ingestão, mas não pode selecionar arquivos individuais.

Você pode ver suas origens de dados na guia Origem de Dados da sua base de conhecimento e ver as informações sobre essa origem de dados clicando em seu nome. A guia Parâmetros fornece informações sobre o volume, o caminho do arquivo, o cluster anexado e os tipos de arquivo selecionados.

Observação:

O AI Data Platform Workbench não suporta jobs de ingestão programados. Você pode ingerir dados imediatamente clicando em Ingerir agora na guia Parâmetros da sua origem de dados.

Você pode ver informações mais detalhadas sobre sua origem de dados na guia Detalhes e ver um histórico de jobs de ingestão de dados na guia Execuções de jobs.

Criar uma Base de Conhecimento

A criação de uma base de conhecimento no AI Data Platform Workbench é uma configuração única que permite registrar uma origem de documento, separar, incorporar e indexar automaticamente arquivos e ativar a pesquisa semântica e a recuperação de RAG por meio de fluxos de agentes.

Não é possível consultar diretamente as bases de conhecimento no AI Data Platform Workbench. Você pode consultar as bases de conhecimento criando uma ferramenta RAG anexada a um agente AI. Para obter mais informações, consulte Agentes de IA.
  1. Clique em Catálogo mestre.
  2. Navegue até o catálogo e o esquema padrão nos quais você deseja criar sua base de conhecimento.
  3. Clique em Bases de Conhecimento.
  4. Clique em Ícone Criar base de conhecimento Criar Base de Conhecimento.

    Caixa de diálogo Criar Base de Conhecimento

  5. Informe um nome e descrição para a sua base de conhecimento.
  6. Selecione um espaço de trabalho e um cluster do Spark para ingestão de arquivo. Se nenhum cluster for selecionado, a Computação do Catálogo Mestre Padrão será usada.
  7. Selecione o modelo de incorporação usado, se necessário.
  8. Forneça o tamanho do bloco e a sobreposição do bloco, se necessário.
  9. Clique em Criar.

Editar uma Base de Conhecimento

Você poderá modificar o nome, a descrição, o cluster, o modelo ou os detalhes de divisão em blocos de uma base de conhecimento existente se tiver as permissões relevantes.

  1. Navegue até a pasta da base de conhecimento.
  2. Ao lado da base de conhecimento que você deseja editar, clique em Ícone de três pontos de ações Ações e, em seguida, clique em Editar.
  3. Faça alterações nos atributos da base de conhecimento.
  4. Clique em Salvar.

Excluir uma Base de Conhecimento

Você pode excluir bases de conhecimento que não precisa mais ou usar do seu catálogo.

  1. Navegue até a pasta da base de conhecimento.
  2. Ao lado da base de conhecimento que você deseja excluir, clique em Ícone de três pontos de ações Ações e, em seguida, clique em Excluir.
  3. Clique em Excluir.

Adicionar uma Origem de Dados a uma Base de Conhecimento

Depois de criar uma base de conhecimento, você precisa designar a ela uma origem de dados para ingestão.

  1. Navegue até sua base de conhecimento.
  2. Clique na guia Origem de Dados.
  3. Clique em Adicionar origem de dados à base de conhecimento Adicionar origem de dados à base de conhecimento.

    Caixa de diálogo Adicionar origem de dados à base de conhecimento

  4. No Catálogo Mestre, selecione o volume ou a pasta em um volume que você deseja ingerir na sua base de conhecimento. Não é possível selecionar arquivos individuais.
  5. Se necessário, selecione o cluster de computação a ser usado para ingestão de dados.
  6. Selecione os tipos de arquivo a serem ingeridos. Os tipos de arquivo suportados são PDF, TXT e DOCX.
  7. Selecione Iniciar job de ingestão ao adicionar para iniciar a ingestão imediatamente após adicionar a origem de dados.
  8. Clique em Adicionar.

Ingestão de Dados em uma Base de Conhecimento

Depois que uma origem de dados é adicionada a uma base de conhecimento, você pode iniciar manualmente uma execução de job de ingestão de dados na guia Parâmetros.

  1. Navegue até sua base de conhecimento.
  2. Na guia Origem de Dados, clique no nome da origem de dados cujo job de ingestão você deseja executar.
  3. Na guia Parâmetros, clique em Ingerir agora.

Exibir Status de Execução do Job de Ingestão

Você pode exibir uma lista de todos os jobs de ingestão da origem de dados na guia Execuções de Jobs da origem de dados.

  1. Navegue até sua base de conhecimento.
  2. Na guia Origem de Dados, clique no nome da origem de dados cujo status você deseja exibir.
  3. Clique na guia Execuções de job.
  4. Use os filtros para restringir a lista de execuções de jobs exibidas.

Excluir uma Origem de Dados

Você pode excluir origens de dados que não precisa mais ou usar da sua base de conhecimento.

A exclusão de uma origem de dados também exclui as incorporações vetoriais correspondentes da sua Plataforma de Dados AI.
  1. Navegue até sua base de conhecimento. Clique na guia Origens de Dados.
  2. Ao lado da origem de dados que você deseja excluir, clique em Ícone de três pontos de ações Ações e, em seguida, clique em Excluir.
  3. Clique em Excluir.