Création d'une base de connaissances dans des agents d'IA générative

Créez une base de connaissances dans le service Agents d'IA générative.

  1. Sur la page de liste Bases de connaissances, sélectionnez Créer une base de connaissances.
    Si vous avez besoin d'aide pour trouver la page de liste, voir Liste des bases de connaissances.
  2. Entrez les informations suivantes :
    • Nom : nom qui commence par une lettre ou un trait de soulignement, suivi de lettres, de chiffres, de tirets ou de traits de soulignement. La longueur peut aller de 1 à 255 caractères.
    • Compartiment : compartiment dans lequel stocker la base de connaissances
    • Description : description facultative
  3. Pour Type de banque de données, sélectionnez une des options suivantes :
  4. Si vous avez sélectionné Object Storage, effectuez les actions suivantes :
    1. Sous Sources de données, sélectionnez Indiquer une source de données, puis entrez un nom et une description facultative pour la source de données.
    2. Sélectionnez le bucket qui contient les données de la base de connaissances. Modifiez le compartiment si le bucket se trouve dans un autre compartiment.
      Reportez-vous à Exigences en matière de données pour Object Storage afin de vous assurer que les fichiers des buckets répondent aux exigences des agents d'IA générative.
    3. Une fois le contenu du bucket répertorié, effectuez l'une des actions suivantes pour sélectionner les fichiers à utiliser :
      • Pour inclure tous les éléments du bucket, sélectionnez Tout sélectionner dans le bucket.
      • Sélectionnez les fichiers et dossiers à inclure.
      • Développez Ajouter des préfixes d'objet manuellement pour saisir les préfixes des fichiers et dossiers à inclure.
    4. (Facultatif) Sélectionnez Afficher les options de balisage et ajoutez des balises à la source de données. Si vous êtes autorisé à créer une ressource, vous pouvez mettre à jour ses balises. Si vous avez besoin d'aide, reportez-vous à Concepts relatifs aux balises et à l'espace de noms de balise.
    5. Sélectionnez Créer.
    6. (Facultatif) Sélectionnez Démarrer automatiquement le travail d'ingestion pour les sources de données ci-dessus.
      Si vous ne sélectionnez pas cette option, vous devez ingérer les données ultérieurement pour que l'agent puisse les utiliser.
    Remarque

    Vous ne pouvez avoir qu'une seule source de données par base de connaissances. Reportez-vous à Limites et limites pour les agents Generative AI.
  5. Si vous avez sélectionné OCI OpenSearch comme type de source de données, entrez les informations suivantes. Pour obtenir des instructions, reportez-vous à Outil RAG OCI Search avec les directives OpenSearch pour les agents d'IA générative.
    • Cluster OpenSearch : sélectionnez le cluster qui contient les données de la base de connaissances. Modifiez le compartiment si le cluster se trouve dans un autre compartiment.
    • index OpenSearch : entrez les détails de l'index OpenSearch. Reportez-vous à Outil RAG OCI Search avec les directives OpenSearch pour les agents d'IA générative.
    • Détails de la clé secrète : sélectionnez l'une des options suivantes :
      • Clé secrète d'authentification de base : pour cette option, sélectionnez la clé secrète de coffre pour OCI Search avec OpenSearch.
      • Clé secrète IDCS : pour cette option, entrez les informations suivantes pour l'application confidentielle IDCS à utiliser pour l'agent :
        • Domaine d'identité : sélectionnez le domaine d'identité à utiliser pour accéder au cluster. Modifiez le compartiment si le domaine d'identité se trouve dans un autre compartiment.
        • ID client : entrez l'ID de l'application client IDCS du cluster OpenSearch.
        • Sault de clé secrète client : sélectionnez le coffre qui contient la clé secrète client. Modifiez le compartiment si la clé secrète se trouve dans un autre compartiment.
        • URL de portée : entrez l'URL qui est l'adresse d'API pour l'application de serveur de ressources du domaine d'identité et inclut la portée de l'agent. Par exemple, pour la portée genaiagent, l'URL est https://*.agent.aiservice.us-chicago-1.oci.oraclecloud.com/genaiagent.

      Pour en savoir plus sur les clusters OpenSearch, consultez la page de détails d'un cluster OpenSearch.

  6. Si vous avez sélectionné Recherche de vecteur Oracle AI comme type de source de données, sélectionnez la connexion à l'outil de base de données, puis Tester la connexion pour confirmer la réussite de la connexion à la base de données. En cas de succès, le nom et la version de la base de données sont affichés. Ensuite, entrez la fonction de recherche vectorielle pour la connexion à l'outil de base de données.
    Remarque

    Pour vous aider à entrer les valeurs de cette étape, reportez-vous à Instructions Oracle Database de l'outil RAG pour les agents d'IA générative.
  7. (Facultatif) Sélectionnez Afficher les options de balisage et ajoutez des balises à la base de connaissances. Si vous êtes autorisé à créer une ressource, vous pouvez mettre à jour ses balises. Si vous avez besoin d'aide, reportez-vous à Concepts relatifs aux balises et à l'espace de noms de balise.
  8. Sélectionnez Créer.

    La base de connaissances prend un certain temps à créer. Une fois la base de connaissances créée, si vous n'avez pas inclus de données pour une source de données Object Storage, suivez les étapes décrites dans Ingestion de données de source de données dans des agents d'IA générative.

    Remarque

    Après l'exécution d'un travail d'inclusion de données pour une source de données Object Storage, consultez les journaux de statut pour vérifier que tous les fichiers mis à jour ont été inclus.

    Si le travail d'inclusion échoue (par exemple, parce qu'un fichier était trop volumineux), résolvez le problème et redémarrez le travail.

    Lorsque vous redémarrez un travail d'assimilation exécuté précédemment, le pipeline détecte les fichiers qui ont été assimilés précédemment et les ignore. Le pipeline ingère uniquement les fichiers qui ont échoué auparavant et ont depuis été mis à jour. Par exemple, vous avez 20 fichiers à ingérer et l'exécution initiale du travail génère 2 fichiers en échec. Lorsque vous redémarrez le travail, le pipeline reconnaît que 18 fichiers ont déjà été inclus et les ignore. Il ingère uniquement les 2 fichiers qui ont échoué précédemment et ont été mis à jour depuis.