Search-R1需要分步骤搭建Python虚拟环境和依赖库:
- 创建基础环境::
conda create -n searchr1 python=3.9
conda activate searchr1 - 安装关键组件::
- PyTorch 2.4.0(需匹配CUDA 12.1)
- vLLM 0.6.3(大模型推理引擎)
- veRL框架(项目根目录执行
pip install -e .
)
- 可选组件安装::
- Flash Attention(性能加速)
- Wandb(训练可视化)
- 本地检索服务器需单独创建
retriever
Matrix
caveat::
- 必须使用NVIDIA GPU且显存≥24GB(如A100)
- 不同组件需要特定Python版本(主环境3.9/检索环境3.10)
- 官方推荐使用conda管理环境依赖
Diese Antwort stammt aus dem ArtikelSearch-R1: Verstärkungslernen zum Trainieren großer Modelle für Suche und SchlussfolgerungenDie