Vorbereitung der Basisumgebung
- Python 3.10 Laufzeitumgebung
- Git-Versionskontrollwerkzeuge
- Empfohlener NVIDIA-Grafikprozessor (16 GB + Videospeicher)
Schritt-für-Schritt-Anleitung
- Erstellen einer virtuellen Umgebung::
conda create -n tpo python=3.10
- Klonprojekt::
git clone https://github.com/Airmomo/tpo-llm-webui.git
- Installation von Abhängigkeiten::
pip install -r requirements.txt
- TextGrad konfigurieren(Kernoptimierungsmaschine):
cd textgrad-main pip install -e .
Modell Konfigurationspunkte
- Basismodell, das von Hugging Face heruntergeladen wird (z. B. DeepSeek-R1-Serie)
- Reward Modelling schlägt vor, ein professionelles Bewertungsmodell zu wählen, das der Aufgabe entspricht
- Einstellung des Modellpfads über die Datei config.yaml
Diese Antwort stammt aus dem ArtikelTPO-LLM-WebUI: Ein KI-Framework, in das Sie Fragen eingeben können, um ein Modell in Echtzeit zu trainieren und die Ergebnisse auszugeben.Die