依赖环境隔离方案
采用项目推荐的Conda环境管理:
- 创建隔离环境:
conda create -n openmanus-rl python=3.10
指定Python版本 - 国内加速:使用清华镜像源安装依赖:
pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple
- Validação de versão:关键依赖包括PyTorch≥2.0、transformers≥4.40,可通过
conda list
sonda
常见问题处理:若遇CUDA版本冲突,建议通过conda install cudatoolkit=11.8
指定CUDA版本。多GPU训练需确保accelerate
配置一致。
Essa resposta foi extraída do artigoOpenManus-RL: ajuste fino de modelos grandes para aprimorar o raciocínio e a tomada de decisões de corpos inteligentesO