Inclusion de données de source de données dans des agents d'IA générative
Un travail d'ingestion de données extrait des données des documents de source de données, les convertit dans un format structuré adapté à l'analyse, puis les stocke dans une base de connaissances.
Remarque
- Après la création d'un travail d'inclusion
-
- Consultez les journaux de statut et de statut pour vérifier que tous les fichiers mis à jour ont bien été ingérés. Si vous avez besoin d'aide pour obtenir les journaux de statut, reportez-vous à Obtention des détails d'un travail d'ingestion de données.
- Si le travail d'ingestion échoue (par exemple, en raison d'un fichier trop volumineux), résolvez le problème et redémarrez le travail.
- Gestion des travaux exécutés précédemment par le pipeline d'ingestion
-
Lorsque vous redémarrez un travail d'ingestion exécuté précédemment, le pipeline :
- Détecte les fichiers qui ont été ingérés précédemment et les ignore.
- Inclut uniquement les fichiers qui ont échoué précédemment et qui ont été mis à jour depuis.
- Exemple de scénario
-
Supposons que vous ayez 20 fichiers à ingérer et que l'exécution initiale du travail génère 2 fichiers en échec. Lorsque vous redémarrez le travail, le pipeline :
- Reconnaît que 18 fichiers ont déjà été ingérés et les ignorent.
- Inclut uniquement les 2 fichiers qui ont échoué précédemment et qui ont été mis à jour depuis.