Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito
Posição atual:fig. início " Respostas da IA

Como faço para treinar para uma tarefa de contagem regressiva usando o TinyZero? Quais são as principais etapas?

2025-09-10 3.0 K

O treinamento da tarefa de contagem regressiva é dividido emPré-processamento de dadosresponder cantandotreinamento de modelosAs duas fases são descritas a seguir:

Fase I: Preparação de dados
Execute o comando:python ./examples/data_preprocess/countdown.py --local_dir {数据集路径}
O script será executado automaticamente:

  1. Gerar dados de treinamento que estejam em conformidade com o formato do modelo Qwen
  2. Criação de um modelo de prompt específico para tarefas de raciocínio numérico
  3. Dividir o conjunto de treinamento/validação (proporção padrão 8:2)

Fase II: Início do treinamento
As variáveis de ambiente precisam ser configuradas:

  • BASE_MODELCaminho do modelo básico (por exemplo, Qwen-1.5B)
  • DATA_DIRCatálogo de dados pré-processados
  • EXPERIMENT_NAMEIdentificação da experiência (para registros wandb)

execução finalbash ./scripts/train_tiny_zero.shInicie o treinamento e o sistema o fará automaticamente:

  1. Rede de estratégia e rede de valor do Load VeRL
  2. Iniciar o Monte Carlo Tree Search (MCTS) para otimização da estratégia
  3. Precisão do conjunto de validação de saída por 100 etapas

Duração típica do treinamento: o modelo 1.5B leva cerca de 3,5 horas para atingir a precisão de validação 90%+ em um único H200.

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

voltar ao topo


Fatal error: Uncaught wfWAFStorageFileException: Unable to save temporary file for atomic writing. in /www/wwwroot/www.kdjingpai.com/wp-content/plugins/wordfence/vendor/wordfence/wf-waf/src/lib/storage/file.php:34 Stack trace: #0 /www/wwwroot/www.kdjingpai.com/wp-content/plugins/wordfence/vendor/wordfence/wf-waf/src/lib/storage/file.php(658): wfWAFStorageFile::atomicFilePutContents() #1 [internal function]: wfWAFStorageFile->saveConfig() #2 {main} thrown in /www/wwwroot/www.kdjingpai.com/wp-content/plugins/wordfence/vendor/wordfence/wf-waf/src/lib/storage/file.php on line 34