Ingestão de Dados da Origem de Dados em Agentes de IA Generativa

Um job de ingestão de dados extrai dados de documentos de origem de dados, os converte em um formato estruturado adequado para análise e os armazena em uma base de conhecimento.

  1. Na página da lista Bases de Conhecimento, selecione a base de conhecimento que você deseja ingerir dados para sua origem de dados.
    Se precisar de ajuda para localizar a página da lista, consulte Listando Bases de Conhecimento.
  2. Selecione a origem de dados que você deseja ingerir seus dados.
  3. Selecione Criar job de Ingestão.
  4. Informe os seguintes valores:
    • Nome: um nome que começa com uma letra ou sublinhado, seguido de letras, números, hifens ou sublinhados. O tamanho pode ser de 1 a 255 caracteres.
    • Descrição: Uma descrição opcional
    • Tags: Selecione Mostrar opções avançadas e adicione uma ou mais tags ao job de ingestão. Se você tiver permissões para criar um recurso, terá permissão para atualizar suas tags. Se precisar de ajuda, consulte Tags e Conceitos de Namespace de Tag.
  5. Selecione Criar.
  6. Aguarde a alteração do status do job de ingestão.

Observação

Após a Criação de um Job de Ingestão
  1. Revise os logs de status para confirmar se todos os arquivos atualizados foram ingeridos com sucesso. Se precisar de ajuda para obter os logs de status, consulte Obtendo Detalhes de um Job de Ingestão de Dados.
  2. Se o job de ingestão falhar (por exemplo, por causa de um arquivo ser muito grande), resolva o problema e reinicie o job.
Como o Pipeline de Ingestão Trata Jobs Executados Anteriormente

Quando você reinicia um job de ingestão executado anteriormente, o pipeline:

  1. Detecta arquivos que foram ingeridos com sucesso anteriormente e os ignora.
  2. Somente ingere arquivos que falharam anteriormente e desde então foram atualizados.
Exemplo de Cenário

Suponha que você tenha 20 arquivos para ingerir e a execução do job inicial resulte em 2 arquivos com falha. Quando você reinicia o job, o pipeline:

  1. Reconhece que 18 arquivos já foram ingeridos com sucesso e os ignora.
  2. Sugere apenas os 2 arquivos que falharam anteriormente e que foram atualizados desde então.