Esegui job di formazione su NVIDIA NeMo Framework
NVIDIA NeMo Framework Launcher è uno strumento cloud nativo per l'avvio di job di formazione NeMo Framework end-to-end su migliaia di GPU per l'addestramento LLM su larga scala. In questo esempio viene utilizzato NeMo Framework Launcher per eseguire il modello di lingua gpt3_5b large
, la preparazione dei dati e le fasi di formazione.
Per ulteriori dettagli sia su NeMo che su NeMo Framework Launcher, consultare la documentazione NVIDIA.
Esegui carico di lavoro formazione LLM
Installare python ed eseguire un carico di lavoro di formazione.
Preparazione dati
La fase di preparazione dei dati esegue tre attività: scaricare il data set non protetto da copyright "the pile", estrarre (non comprimere) i dati e pre-elaborare i dati.
- 90 minuti da scaricare
- 46 minuti da estrarre
- 5 ore e 45 minuti per la pre-elaborazione