依赖环境隔离方案
采用项目推荐的Conda环境管理:
- 创建隔离环境:
conda create -n openmanus-rl python=3.10
指定Python版本 - 国内加速:使用清华镜像源安装依赖:
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
- 版本验证:关键依赖包括PyTorch≥2.0、transformers≥4.40,可通过
conda list
检查
常见问题处理:若遇CUDA版本冲突,建议通过conda install cudatoolkit=11.8
指定CUDA版本。多GPU训练需确保accelerate
配置一致。
本答案来源于文章《OpenManus-RL:微调大模型强化智能体推理与决策能力》