Criando uma Base de Conhecimento em Agentes de IA Generativa
Crie uma base de conhecimento no serviço Generative AI Agents.
- Na página da lista Bases de conhecimento, selecione Criar base de conhecimento. Se precisar de ajuda para localizar a página da lista, consulte Listando Bases de Conhecimento.
-
Digite as seguintes informações:
- Nome: um nome que começa com uma letra ou sublinhado, seguido de letras, números, hifens ou sublinhados. O tamanho pode ser de 1 a 255 caracteres.
- Compartimento: O compartimento no qual você deseja armazenar a base de conhecimento
- Descrição: Uma descrição opcional
-
Para Tipo de armazenamento de dados, selecione uma das seguintes opções:
- Armazenamento de objetos. Consulte Diretrizes de Armazenamento de Objetos da Ferramenta RAG.
- OCI OpenSearch:
Você deve ter documentos divididos em blocos em arquivos com menos de 512 tokens cada, e deve ter ingerido e indexado esses documentos em OpenSearch antes de continuar. Consulte RAG Tool OCI Search com Diretrizes OpenSearch.
- Banco de Dados AI Vector Search:
-
Para dados no Oracle Database 23ai. Consulte Diretrizes do Oracle Database da Ferramenta RAG para obter a configuração necessária.
-
Para dados no HeatWave MySQL. Consulte as Diretrizes MySQL do RAG Tool Heatwave para obter a configuração necessária.
-
-
Se você selecionou Armazenamento de objetos, execute as seguintes ações:
- Em Origens de dados, selecione Especificar origem de dados e digite um nome e uma descrição opcional para a origem de dados.
-
Selecione o bucket que contém os dados da base de conhecimento. Altere o compartimento se o bucket estiver em outro compartimento.
Consulte Diretrizes do Serviço RAG Tool Object Storage para garantir que os arquivos nos buckets atendam aos requisitos dos Agentes do Serviço Generative AI.
-
Depois que o conteúdo do bucket for listado, execute uma das seguintes ações para selecionar os arquivos a serem usados:
- Para incluir todos os itens no bucket, clique em Selecionar tudo no bucket.
- Selecione os arquivos e as pastas a serem incluídos.
- Expanda Adicionar prefixos de objeto manualmente para digitar os prefixos dos arquivos e pastas a serem incluídos.
- (Opcional) Selecione Iniciar automaticamente o job de ingestão para origens de dados acima.
Se você não selecionar essa opção, deverá ingerir os dados posteriormente para que o agente os use.
Observação
Você só pode ter uma origem de dados por base de conhecimento. Consulte Limites e Limitações para Agentes de IA Generativa. -
Se você selecionou OCI OpenSearch para o tipo de origem de dados, especifique as informações a seguir. Para obter diretrizes, consulte RAG Tool OCI Search with OpenSearch Guidelines.
-
Para o cluster OpenSearch, selecione o cluster que contém os dados da base de conhecimento. Altere o compartimento se o cluster estiver em outro compartimento.
Para saber mais sobre clusters OpenSearch, leia sobre uma página de detalhes do cluster OpenSearch.
- Para índice OpenSearch, informe os detalhes do índice OpenSearch. Consulte RAG Tool OCI Search com as Diretrizes OpenSearch.
-
Para Detalhes do segredo, selecione uma das seguintes opções:
- Segredo básico de autenticação: Para essa opção, selecione o segredo do Vault para o OCI Search com OpenSearch.
- Segredo do IDCS: Para esta opção, especifique as seguintes informações para o aplicativo confidencial do IDCS que você deseja usar para o agente:
- Domínio de identidades: Selecione o domínio de identidades a ser usado para acessar o cluster. Altere o compartimento se o domínio de identidades estiver em outro compartimento.
- ID do Cliente: Informe o ID do aplicativo cliente IDCS do cluster OpenSearch.
- Vault secreto do cliente: Selecione o vault que contém o segredo do cliente. Altere o compartimento se o segredo estiver em outro compartimento.
- URL do Escopo: Informe o URL que é o ponto final da API para o aplicativo do servidor de recursos do domínio de identidades e inclui o escopo do agente. Por exemplo, para o escopo
genaiagent
, o URL éhttps://*.agent.aiservice.us-chicago-1.oci.oraclecloud.com/genaiagent
.
-
Para o cluster OpenSearch, selecione o cluster que contém os dados da base de conhecimento. Altere o compartimento se o cluster estiver em outro compartimento.
-
Se você selecionou o Oracle AI Vector Search para o tipo de origem de dados, selecione a conexão da ferramenta de banco de dados e, em seguida, selecione Testar conexão para confirmar uma conexão bem-sucedida com o banco de dados. Se o banco de dados for bem-sucedido, o nome e a versão serão exibidos. Em seguida, informe a função de pesquisa vetorial ou o procedimento para a conexão da ferramenta de banco de dados.
Observação
Consulte as Diretrizes do Oracle Database sobre a Ferramenta RAG ou as Diretrizes do MySQL sobre o Heatwave da Ferramenta RAG para obter informações sobre a função ou procedimento. - (Opcional) Selecione Mostrar opções de tag e adicione uma ou mais tags a esse recurso. Se você tiver permissões para criar um recurso, também terá permissões para aplicar tags de formato livre a esse recurso. Para aplicar uma tag definida, você deve ter permissões para usar o namespace da tag. Para obter mais informações sobre tags, consulte Tags de Recurso. Se você não tiver certeza se deseja aplicar tags, ignore essa opção ou pergunte a um administrador. Você pode aplicar tags posteriormente.
-
Selecione Criar.
A base de conhecimento leva algum tempo para ser criada. Após a criação da base de conhecimento, se você não tiver ingerido dados para uma origem de dados do serviço Object Storage, siga as etapas em Ingestão de Dados da Origem de Dados em Agentes de IA Generativa.
Observação
Após a execução de um job de ingestão de dados para uma origem de dados do serviço Object Storage, revise os logs de status e status para confirmar se todos os arquivos atualizados foram ingeridos com sucesso.
Para obter o significado do status de um job de ingestão e a ação a ser tomada se houver um problema de falha, consulte Ingestão de Dados da Origem de Dados, Etapa 6.
Se o job de ingestão falhar (por exemplo, porque um arquivo era muito grande), resolva o problema e reinicie o job.
Quando você reinicia um job de ingestão executado anteriormente, o pipeline detecta arquivos que foram ingeridos anteriormente com sucesso e os ignora. O pipeline ingere apenas arquivos que falharam antes e desde então foram atualizados. Por exemplo, você tem 20 arquivos para ingerir, e a execução do job inicial resulta em 2 arquivos com falha. Quando você reinicia o job, o pipeline reconhece que 18 arquivos já foram ingeridos com sucesso e os ignora. Ele ingere apenas os 2 arquivos que falharam anteriormente e desde então foram atualizados.