Création d'une base de connaissances dans des agents d'IA générative

Créez une base de connaissances dans le service Agents d'IA générative.

  1. Sur la page de liste Bases de connaissances, sélectionnez Créer une base de connaissances. Si vous avez besoin d'aide pour trouver la page de liste, reportez-vous à la rubrique Liste des bases de connaissances.
  2. Entrez les informations suivantes :
    • Nom : nom qui commence par une lettre ou un trait de soulignement, suivi de lettres, de chiffres, de tirets ou de traits de soulignement. La longueur peut aller de 1 à 255 caractères.
    • Compartiment : compartiment dans lequel stocker la base de connaissances
    • Description : description facultative
  3. Pour Type de banque de données, sélectionnez une des options suivantes :
  4. Si vous avez sélectionné Object Storage, effectuez les actions suivantes :
    1. Sous Sources de données, sélectionnez Indiquer une source de données, puis entrez un nom et une description facultative pour la source de données.
    2. Sélectionnez le bucket qui contient les données de la base de connaissances. Modifiez le compartiment si le bucket se trouve dans un autre compartiment.
      Reportez-vous à Instructions Object Storage de l'outil RAG pour vous assurer que les fichiers des buckets répondent aux exigences des agents d'IA générative.
    3. Une fois le contenu du bucket répertorié, effectuez l'une des actions suivantes pour sélectionner les fichiers à utiliser :
      • Pour inclure tous les éléments dans le bucket, cliquez sur Tout sélectionner dans le bucket.
      • Sélectionnez les fichiers et dossiers à inclure.
      • Développez Ajouter des préfixes d'objet manuellement pour saisir les préfixes des fichiers et dossiers à inclure.
    4. (Facultatif) Sélectionnez Démarrer automatiquement le travail d'ingestion pour les sources de données ci-dessus.
      Si vous ne sélectionnez pas cette option, vous devez ingérer les données ultérieurement pour que l'agent puisse les utiliser.
    Remarque

    Vous ne pouvez avoir qu'une seule source de données par base de connaissances. Reportez-vous à Limites et limites pour les agents Generative AI.
  5. Si vous avez sélectionné OCI OpenSearch pour le type de source de données, entrez les informations suivantes. Pour obtenir des instructions, reportez-vous à la section RAG Tool OCI Search with OpenSearch Guidelines.
    1. Dans cluster OpenSearch, sélectionnez le cluster qui contient les données de la base de connaissances. Modifiez le compartiment si le cluster se trouve dans un autre compartiment.

      Pour en savoir plus sur les clusters OpenSearch, consultez la page de détails d'un cluster OpenSearch.

    2. Dans index OpenSearch, entrez les détails de l'index OpenSearch. Reportez-vous à Recherche OCI de l'outil RAG avec des instructions OpenSearch.
    3. Pour Détails de clé secrète, sélectionnez l'une des options suivantes :
      • Clé secrète d'authentification de base : pour cette option, sélectionnez la clé secrète de coffre pour OCI Search avec OpenSearch.
      • Clé secrète IDCS : pour cette option, entrez les informations suivantes pour l'application confidentielle IDCS à utiliser pour l'agent :
        • Domaine d'identité : sélectionnez le domaine d'identité à utiliser pour accéder au cluster. Modifiez le compartiment si le domaine d'identité se trouve dans un autre compartiment.
        • ID client : entrez l'ID de l'application client IDCS du cluster OpenSearch.
        • Sault de clé secrète client : sélectionnez le coffre qui contient la clé secrète client. Modifiez le compartiment si la clé secrète se trouve dans un autre compartiment.
        • URL de portée : entrez l'URL qui est l'adresse d'API pour l'application de serveur de ressources du domaine d'identité et inclut la portée de l'agent. Par exemple, pour la portée genaiagent, l'URL est https://*.agent.aiservice.us-chicago-1.oci.oraclecloud.com/genaiagent.
  6. Si vous avez sélectionné Oracle AI Vector Search pour le type de source de données, sélectionnez la connexion à l'outil de base de données, puis Tester la connexion pour confirmer la réussite de la connexion à la base de données. En cas de succès, le nom et la version de la base de données sont affichés. Ensuite, entrez la fonction ou la procédure de recherche vectorielle pour la connexion à Database Tool.
    Remarque

    Pour plus d'informations sur la fonction ou la procédure, reportez-vous aux instructions Oracle Database de l'outil RAG ou aux instructions Heatwave MySQL de l'outil RAG.
  7. (Facultatif) Sélectionnez Afficher les options de balisage et ajoutez des balises à cette ressource. Si vous disposez des droits d'accès nécessaires pour créer une ressource, vous disposez également de droits d'accès permettant d'appliquer des balises à format libre à cette ressource. Pour appliquer une balise définie, vous devez disposer des droits d'accès nécessaires pour utiliser l'espace de noms de balise. Pour plus d'informations sur le balisage, reportez-vous à Balises de ressource. Si vous n'êtes pas certain d'appliquer des balises, ignorez cette option ou demandez à un administrateur. Vous pouvez appliquer des balises ultérieurement.
  8. Sélectionnez Créer.

    La base de connaissances prend un certain temps à créer. Une fois la base de connaissances créée, si vous n'avez pas inclus de données pour une source de données Object Storage, suivez les étapes décrites dans Ingestion de données de source de données dans des agents d'IA générative.

    Remarque

    Après l'exécution d'un travail d'inclusion de données pour une source de données Object Storage, consultez les journaux de statut et de statut pour vérifier que tous les fichiers mis à jour ont été inclus.

    Pour connaître la signification d'un statut de travail d'inclusion et l'action à effectuer en cas de problème d'échec, reportez-vous à Ingestion de données de source de données, étape 6.

    Si le travail d'inclusion échoue (par exemple, parce qu'un fichier était trop volumineux), résolvez le problème et redémarrez le travail.

    Lorsque vous redémarrez un travail d'assimilation exécuté précédemment, le pipeline détecte les fichiers qui ont été assimilés précédemment et les ignore. Le pipeline ingère uniquement les fichiers qui ont échoué auparavant et ont depuis été mis à jour. Par exemple, vous avez 20 fichiers à ingérer et l'exécution initiale du travail génère 2 fichiers en échec. Lorsque vous redémarrez le travail, le pipeline reconnaît que 18 fichiers ont déjà été inclus et les ignore. Il ingère uniquement les 2 fichiers qui ont échoué précédemment et ont été mis à jour depuis.