Exécuter les travaux de formation NVIDIA NeMo Framework
NVIDIA NeMo Framework Launcher est un outil cloud natif permettant de lancer des travaux de formation NeMo Framework de bout en bout sur des milliers de GPU pour une formation LLM à grande échelle. Dans cet exemple, nous utilisons le lanceur de structure NeMo pour exécuter le modèle de langage gpt3_5b large
, les étapes de préparation des données et d'entraînement.
Reportez-vous à la documentation NVIDIA pour plus de détails sur NeMo et le lanceur de structure NeMo :
Exécuter une charge de travail de formation LLM
Installez python et exécutez une charge globale d'entraînement.
Préparation des données
L'étape de préparation des données effectue trois tâches : télécharger l'ensemble de données sans droits d'auteur "the pile", extraire (décompresser) les données et prétraiter les données.
- 90 minutes à télécharger
- 46 minutes à extraire
- 5 heures 45 minutes pour le prétraitement