Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito
Posição atual:fig. início " Respostas da IA

Como faço para treinar um modelo usando o projeto Open R1?

2025-09-10 2.2 K

As etapas a seguir precisam ser seguidas para treinar um modelo usando o projeto Open R1:

  1. Configuração do ambiente: Primeiro, crie um ambiente virtual Python e ative o
    conda create -n openr1 python=3.11
    conda activate openr1
  2. Instalação de dependênciasInstalação do vLLM e das dependências do projeto
    pip install vllm==0.6.6.post1
    pip install -e ".[dev]"
  3. Login da conta: Faça login nas contas Hugging Face e Weights and Biases
    huggingface-cli login
    wandb login
  4. Modelos de treinamentoTreinamento usando os scripts fornecidos
    • Treinamento GRPO:
      python src/open_r1/grpo.py --dataset <dataset_path>
    • Treinamento em SFT:
      python src/open_r1/sft.py --dataset <dataset_path>

Em especial, o projeto oferece suporte ao treinamento em vários estágios, que pode começar com um modelo básico e passar gradualmente para um modelo de ajuste de aprendizado por reforço.

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

voltar ao topo