ReSearch的部署需要以下硬件和软件条件:
- 硬件需求:
– 训练阶段:需配备至少24GB显存的NVIDIA GPU
– 评估阶段:需要16GB以上显存 - 软件环境:
– Linux系统(Ubuntu推荐)
– Python 3.11+
– CUDA 12.4(需与PyTorch版本匹配)
详细安装步骤如下:
- 克隆仓库:
git clone https://github.com/Agent-RL/ReSearch.git
- 安装verl强化学习框架: 进入verl目录执行
pip3 install -e .
- 安装FlashRAG评估系统: 克隆并安装相应仓库
- 下载Qwen2.5-7B预训练模型: 通过Hugging Face获取
注意依赖版本需严格匹配:
– torch==2.4.0+cu124
– vllm==0.6.3
– ray==2.10.0
出现冲突时需要手动指定安装。
本答案来源于文章《ReSearch:强化搜索推理能力的 Qwen2.5-7B 模型(实验)》