Exécuter les tâches de formation NVIDIA NeMo Framework
NVIDIA NeMo Framework Launcher est un outil en nuage natif permettant de lancer des tâches de formation NeMo Framework de bout en bout sur des milliers de GPU pour une formation LLM à grande échelle. Dans cet exemple, nous utilisons le lanceur de cadre NeMo pour exécuter le modèle de langage gpt3_5b large
, la préparation des données et les étapes d'entraînement.
Pour plus de détails sur NeMo et le lanceur de cadre NeMo, consultez la documentation NVIDIA :
Exécuter une charge de travail de formation LLM
Installez python et exécutez une charge de travail d'entraînement.
Préparation des données
L'étape de préparation des données effectue trois tâches : télécharger le jeu de données non protégé par les droits d'auteur " la pile ", extraire (décompresser) les données et prétraiter les données.
- 90 minutes à télécharger
- 46 minutes à extraire
- 5 heures 45 minutes pour le prétraitement