Création d'une base de connaissances dans les agents IA génératifs

Créez une base de connaissances dans le service Agents IA génératifs.

Dans la page de liste Bases de connaissances, sélectionnez Créer une base de connaissances. Si vous avez besoin d'aide pour trouver la page de liste, voir Liste des bases de connaissances.
Entrez les informations suivantes :
- Nom : Nom qui commence par une lettre ou un soulignement, suivi de lettres, de chiffres, de traits d'union ou de traits de soulignement. Il peut comporter de 1 à 255 caractères.
- Compartiment : Compartiment dans lequel stocker la base de connaissances
- Description : Description facultative
Pour Type de magasin de données, sélectionnez l'une des options suivantes :
- Stockage d'objets. Voir Directives relatives au stockage d'objets de l'outil RAG.
- OpenSearch pour OCI :
  Vous devez avoir des documents segmentés en fichiers avec moins de 512 jetons chacun, et vous devez avoir ingéré et indexé ces documents dans OpenSearch avant de continuer. Voir Recherche OCI avec outils RAG avec directives OpenSearch.
- Recherche de vecteur d'IA de base de données :
  - Pour les données dans Oracle AI Database 26ai. Voir Directives relatives à Oracle Database pour l'outil RAG pour la configuration requise.
  - Pour les données dans MySQL HeatWave MySQL. Pour la configuration requise, voir Directives relatives à l'outil RAG Heatwave MySQL.
Si vous avez sélectionné Stockage d'objets, effectuez les actions suivantes :
1. Sous Sources de données, sélectionnez Spécifier la source de données et entrez un nom et une description facultative pour la source de données.
2. Sélectionnez le seau qui contient les données de la base de connaissances. Modifiez le compartiment si le seau se trouve dans un autre compartiment.
  Voir Directives relatives au stockage d'objets de l'outil RAG pour vous assurer que les fichiers des seaux répondent aux exigences des agents d'IA générative.
3. Une fois le contenu du seau répertorié, effectuez l'une des actions suivantes pour sélectionner les fichiers à utiliser :
  - Pour inclure tous les articles dans le seau, cliquez sur Tout sélectionner dans le seau.
  - Sélectionnez les fichiers et les dossiers à inclure.
  - Développez Ajouter des préfixes d'objet manuellement pour taper les préfixes des fichiers et dossiers à inclure.
4. (Facultatif) Sélectionnez Démarrer automatiquement la tâche d'ingestion pour les sources de données ci-dessus.
  Si vous ne sélectionnez pas cette option, vous devez ingérer les données plus tard pour que l'agent puisse les utiliser.
Note

Vous ne pouvez avoir qu'une seule source de données par base de connaissances. Voir Limites et limites pour les agents d'IA générative.
Si vous avez sélectionné OCI OpenSearch pour le type de source de données, entrez les informations suivantes. Pour les directives, voir Recherche OCI avec outils RAG avec directives OpenSearch.
1. Pour Grappe OpenSearch, sélectionnez la grappe qui contient les données de la base de connaissances. Modifiez le compartiment si la grappe se trouve dans un autre compartiment.
  
  Pour en savoir plus sur les grappes OpenSearch, consultez la page de détails d'une grappe OpenSearch.
2. Pour l'index OpenSearch, entrez les détails de l'index OpenSearch. Voir Recherche OCI avec outils RAG OpenSearch Directives.
3. Pour Détails de la clé secrète, sélectionnez une des options suivantes :
  - Clé secrète d'authentification de base : Pour cette option, sélectionnez la clé secrète de chambre forte pour la recherche OCI avec OpenSearch.
  - Clé secrète IDCS : Pour cette option, entrez les informations suivantes pour l'application confidentielle IDCS que vous voulez utiliser pour l'agent :
    - Domaine d'identité : Sélectionnez le domaine d'identité à utiliser pour accéder à la grappe. Modifiez le compartiment si le domaine d'identité se trouve dans un autre compartiment.
    - ID client : Entrez l'ID de l'application client IDCS de la grappe OpenSearch.
    - Chambre forte de clés secrètes du client : Sélectionnez la chambre forte qui contient la clé secrète du client. Modifiez le compartiment si la clé secrète se trouve dans un autre compartiment.
    - URL d'étendue : Entrez l'URL qui est le point d'extrémité d'API pour l'application de serveur de ressources du domaine d'identité et qui inclut la portée de l'agent. Par exemple, pour la portée genaiagent, l'URL est https://*.agent.aiservice.us-chicago-1.oci.oraclecloud.com/genaiagent.
Si vous avez sélectionné Oracle AI Vector Search pour le type de source de données, sélectionnez la connexion à l'outil de base de données, puis sélectionnez Tester la connexion pour confirmer la réussite de la connexion à la base de données. En cas de succès, le nom et la version de la base de données sont affichés. Entrez ensuite la fonction ou la procédure de recherche vectorielle pour la connexion à l'outil de base de données.

Note

Pour plus d'informations sur la fonction ou la procédure, voir Directives Oracle Database pour l'outil RAG ou Directives MySQL pour l'outil RAG Heatwave.
(Facultatif) Sélectionnez Afficher les options de marquage et ajoutez un ou plusieurs marqueurs à cette ressource. Si vous êtes autorisé à créer une ressource, vous pouvez également appliquer des marqueurs à structure libre à cette ressource. Pour appliquer un marqueur défini, vous devez être autorisé à utiliser l'espace de noms de marqueur. Pour plus d'informations sur le marquage, voir Marqueurs de ressource. Si vous ne savez pas si vous devez appliquer des marqueurs, ignorez cette option ou demandez à un administrateur. Vous pouvez appliquer des marqueurs plus tard.
Sélectionnez Créer.

La création de la base de connaissances prend un certain temps. Une fois la base de connaissances créée, si vous n'avez pas ingéré de données pour une source de données de stockage d'objets, suivez les étapes sous Ingégration des données de source de données dans les agents d'IA générative.

Note

Après l'exécution d'un travail d'ingestion de données pour une source de données du service de stockage d'objets, vérifiez les journaux de statut et de statut pour confirmer que tous les fichiers mis à jour ont été ingérés.

Pour connaître la signification du statut d'un travail d'ingestion et l'action à entreprendre en cas de problème d'échec, voir Ingégration des données de source de données, étape 6.

Si le travail d'ingestion échoue (par exemple, parce qu'un fichier était trop volumineux), résolvez le problème et redémarrez le travail.

Lorsque vous redémarrez un travail d'ingestion exécuté précédemment, le pipeline détecte les fichiers qui ont été ingérés précédemment et les ignore. Le pipeline ingère uniquement les fichiers qui ont échoué auparavant et qui ont été mis à jour depuis. Par exemple, vous avez 20 fichiers à ingérer et l'exécution initiale de la tâche entraîne 2 fichiers en échec. Lorsque vous redémarrez le travail, le pipeline reconnaît que 18 fichiers ont déjà été ingérés avec succès et les ignore. Il ingère uniquement les 2 fichiers qui ont échoué plus tôt et qui ont depuis été mis à jour.

Documentation sur Oracle Cloud Infrastructure

Création d'une base de connaissances dans les agents IA génératifs