Preparação do ambiente básico
- Python 3.10运行环境
- Ferramentas de controle de versão Git
- 推荐NVIDIA GPU(16GB+显存)
Guia de instalação passo a passo
- Criação de um ambiente virtual::
conda create -n tpo python=3.10
- projeto de clonagem::
git clone https://github.com/Airmomo/tpo-llm-webui.git
- Instalação de dependências::
pip install -r requirements.txt
- 配置TextGrad(核心优化引擎):
cd textgrad-main pip install -e .
模型配置要点
- 基础模型需从Hugging Face下载(如DeepSeek-R1系列)
- 奖励模型建议选择与任务匹配的专业评估模型
- 通过config.yaml文件设置模型路径
Essa resposta foi extraída do artigoTPO-LLM-WebUI: uma estrutura de IA em que você pode inserir perguntas para treinar um modelo em tempo real e gerar os resultados.O