Search-R1需要分步骤搭建Python虚拟环境和依赖库:
- 创建基础环境:
conda create -n searchr1 python=3.9
conda activate searchr1 - 安装关键组件:
- PyTorch 2.4.0(需匹配CUDA 12.1)
- vLLM 0.6.3(大模型推理引擎)
- veRL框架(项目根目录执行
pip install -e .
)
- 可选组件安装:
- Flash Attention(性能加速)
- Wandb(训练可视化)
- 本地检索服务器需单独创建
retriever
环境
注意事项:
- 必须使用NVIDIA GPU且显存≥24GB(如A100)
- 不同组件需要特定Python版本(主环境3.9/检索环境3.10)
- 官方推荐使用conda管理环境依赖
本答案来源于文章《Search-R1:强化学习训练大模型搜索与推理的工具》