Ingestión de datos de origen de datos en agentes de IA generativa
Un trabajo de ingestión de datos extrae datos de documentos de origen de datos, los convierte en un formato estructurado adecuado para el análisis y, a continuación, los almacena en una base de conocimientos.
Nota
- Después de crear un trabajo de ingesta
-
- Revise los logs de estado para confirmar que todos los archivos actualizados se han ingerido correctamente. Si necesita ayuda para obtener los logs de estado, consulte Obtención de detalles de un trabajo de ingesta de datos.
- Si el trabajo de ingestión falla (por ejemplo, debido a que un archivo es demasiado grande), solucione el problema y reinicie el trabajo.
- Cómo gestiona el pipeline de ingesta los trabajos ejecutados anteriormente
-
Al reiniciar un trabajo de ingestión ejecutado anteriormente, el pipeline:
- Detecta los archivos que se han ingerido anteriormente correctamente y los omite.
- Solo ingiere archivos que han fallado anteriormente y que se han actualizado desde entonces.
- Escenario de ejemplo
-
Supongamos que tiene 20 archivos para ingerir y la ejecución del trabajo inicial da como resultado 2 archivos fallidos. Al reiniciar el trabajo, el pipeline:
- Reconoce que 18 archivos ya se han ingerido correctamente y los ignora.
- Ingiere solo los 2 archivos que han fallado anteriormente y que se han actualizado desde entonces.