Tifa-Deepsex-14b-CoT ist ein speziell für große Sprachen optimiertes Modell, das auf der Deepseek-R1-14B-Architektur basiert und durch mehrstufiges Training und die 128k-Technologie zur Unterstützung ultralanger Kontexte zwei bahnbrechende Ergebnisse erzielt:
- Verbesserung des RollenspielsDas Modell verwendet den 671B-Parameter-RL-Belohnungsalgorithmus, der das Problem löst, dass der ursprüngliche Modelldialogcharakter nicht passt. Durch die Verschmelzung von 10K manuellen Annotationen und 100K generativen SFT-Daten können mehrere Dialogrunden, die den Charaktereinstellungen entsprechen, genau generiert werden.
- Optimierung der Erzeugung von LangformatenInkrementelles Pre-Training von 0,4T neuartigem Korpus und die Einführung eines Anti-Duplikations-DPO-Mechanismus, was zu einer Kohärenzverbesserung von 52% für Texte von 200.000 Wörtern oder mehr und einer Genauigkeitsrate von 98% bei der Korrektur von Chinesisch/Englisch-Verwechslungen führt.
Das Modell ist in drei quantisierten Versionen (F16/Q8/Q4) erhältlich und erreicht auf einer RTX4090-Grafikkarte eine Inferenzgeschwindigkeit von 18 Token pro Sekunde, was es zu einem der wenigen kommerziell einsetzbaren Modelle für die Erstellung langer Texte macht.
Diese Antwort stammt aus dem ArtikelTifa-Deepsex-14b-CoT: ein großes Modell, das sich auf Rollenspiele und die Erstellung ultralanger Fiktion spezialisiert hatDie































