Ejecutar trabajos de formación de marco NVIDIA NeMo
NVIDIA NeMo Framework Launcher es una herramienta nativa de la nube para iniciar trabajos de formación de NeMo Framework de extremo a extremo en miles de GPU para la formación de LLM a gran escala. En este ejemplo, utilizamos NeMo Framework Launcher para ejecutar el modelo de lenguaje gpt3_5b large
, las etapas de preparación de datos y entrenamiento.
Consulte la documentación de NVIDIA para obtener más información sobre NeMo y NeMo Framework Launcher:
Ejecución de una carga de trabajo de formación de LLM
Instale python y ejecute una carga de trabajo de formación.
Preparación de Datos
La etapa de preparación de datos realiza tres tareas: descargar el juego de datos sin derechos de autor de "la pila", extraer (descomprimir) los datos y procesar previamente los datos.
- 90 minutos para descargar
- 46 minutos para extraer
- 5 horas 45 minutos para preprocesamiento