依赖环境隔离方案
采用项目推荐的Conda环境管理:
- 创建隔离环境:
conda create -n openmanus-rl python=3.10
指定Python版本 - 国内加速:使用清华镜像源安装依赖:
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
- 版本验证:关键依赖包括PyTorch≥2.0、transformers≥4.40,可通过
conda list
probe
常见问题处理:若遇CUDA版本冲突,建议通过conda install cudatoolkit=11.8
指定CUDA版本。多GPU训练需确保accelerate
配置一致。
This answer comes from the articleOpenManus-RL: Fine-tuning Large Models to Enhance Intelligent Body Reasoning and Decision MakingThe