Histórico
O Open R1 é um grande projeto de código aberto lançado pela Hugging Face, cujo principal objetivo é reproduzir completamente o processo de treinamento do DeepSeek-R1 e fornecer à comunidade de pesquisa uma referência de código aberto verificável e aprimorada.
centro
- O projeto segue rigorosamente o processo de treinamento em três fases do relatório técnico do DeepSeek-R1
- Inclui uma infraestrutura completa de scripts de treinamento, ferramentas de avaliação e ferramentas de geração de dados
- Suporta a replicação completa do processo, desde o treinamento do modelo básico até o ajuste da RL
- Garante a compatibilidade usando pilhas de tecnologia, como Python 3.11 e vLLM 0.6.6
ponto de partida
A natureza de código aberto do projeto Open R1 o torna um excelente recurso da comunidade para compreender e aprimorar a família de modelos DeepSeek-R1, e os desenvolvedores podem basear seu treinamento personalizado e a validação dos resultados nesse projeto.
Essa resposta foi extraída do artigoOpen R1: o rosto abraçado replica o processo de treinamento do DeepSeek-R1O































