基础环境准备
- Python 3.10运行环境
- Git版本控制工具
- 推荐NVIDIA GPU(16GB+显存)
分步安装指南
- 创建虚拟环境:
conda create -n tpo python=3.10
- 克隆项目:
git clone https://github.com/Airmomo/tpo-llm-webui.git
- 安装依赖:
pip install -r requirements.txt
- 配置TextGrad(核心优化引擎):
cd textgrad-main pip install -e .
模型配置要点
- 基础模型需从Hugging Face下载(如DeepSeek-R1系列)
- 奖励模型建议选择与任务匹配的专业评估模型
- 通过config.yaml文件设置模型路径
本答案来源于文章《TPO-LLM-WebUI:输入问题即可实时训练模型输出结果的AI框架》