Executar Jobs de Treinamento do Framework NVIDIA NeMo
O NVIDIA NeMo Framework Launcher é uma ferramenta nativa da nuvem para lançar trabalhos de treinamento completos do NeMo Framework em milhares de GPUs para treinamento de LLM em larga escala. Neste exemplo, usamos o NeMo Framework Launcher para executar o modelo de linguagem gpt3_5b large
, a preparação de dados e os estágios de treinamento.
Consulte a documentação da NVIDIA para obter mais detalhes sobre o NeMo e o NeMo Framework Launcher:
Execute uma Carga de Trabalho de Treinamento LLM
Instale o python e execute uma carga de trabalho de treinamento.
Preparação de Dados
O estágio de preparação de dados executa três tarefas: fazer download do conjunto de dados "a pilha" sem problemas; extrair (descompactar) os dados e pré-processar os dados.
- 90 minutos para download
- 46 minutos para extrair
- 5 horas 45 minutos para pré-processamento