海外からのアクセス:www.kdjingpai.com
Ctrl + D このサイトをブックマークする
現在の場所図頭 " AIアンサー

Open R1プロジェクトを使ってモデルをトレーニングするには?

2025-09-10 2.2 K

Open R1 プロジェクトを使用してモデルをトレーニングするには、以下の手順に従う必要があります:

  1. 環境設定まず、Pythonの仮想環境を作成し、次のコマンドを実行します。
    conda create -n openr1 python=3.11
    conda activate openr1
  2. 依存関係のインストールvLLMとプロジェクトの依存関係のインストール
    pip install vllm==0.6.6.post1
    pip install -e ".[dev]"
  3. アカウントログインハギング・フェイスとウェイト・アンド・バイアスのアカウントにログインしてください。
    huggingface-cli login
    wandb login
  4. トレーニングモデル提供されたスクリプトを使用したトレーニング
    • GRPOトレーニング:
      python src/open_r1/grpo.py --dataset <dataset_path>
    • SFTトレーニング
      python src/open_r1/sft.py --dataset <dataset_path>

特筆すべきは、このプロジェクトは、ベースモデルから始めて徐々に強化学習チューニングモデルに移行できる多段階トレーニングをサポートしていることだ。

おすすめ

AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

トップに戻る