Derzeitige Position:Abb. Anfang " AI-Antworten

Tifa-Deepsex-14b-CoT ist ein parametrisches 14B-Makromodell, das für Rollenspiele und die Erstellung langer Geschichten optimiert ist.

2025-09-10

3.6 K

Tifa-Deepsex-14b-CoT ist ein speziell für große Sprachen optimiertes Modell, das auf der Deepseek-R1-14B-Architektur basiert und durch mehrstufiges Training und die 128k-Technologie zur Unterstützung ultralanger Kontexte zwei bahnbrechende Ergebnisse erzielt:

Verbesserung des RollenspielsDas Modell verwendet den 671B-Parameter-RL-Belohnungsalgorithmus, der das Problem löst, dass der ursprüngliche Modelldialogcharakter nicht passt. Durch die Verschmelzung von 10K manuellen Annotationen und 100K generativen SFT-Daten können mehrere Dialogrunden, die den Charaktereinstellungen entsprechen, genau generiert werden.
Optimierung der Erzeugung von LangformatenInkrementelles Pre-Training von 0,4T neuartigem Korpus und die Einführung eines Anti-Duplikations-DPO-Mechanismus, was zu einer Kohärenzverbesserung von 52% für Texte von 200.000 Wörtern oder mehr und einer Genauigkeitsrate von 98% bei der Korrektur von Chinesisch/Englisch-Verwechslungen führt.

Das Modell ist in drei quantisierten Versionen (F16/Q8/Q4) erhältlich und erreicht auf einer RTX4090-Grafikkarte eine Inferenzgeschwindigkeit von 18 Token pro Sekunde, was es zu einem der wenigen kommerziell einsetzbaren Modelle für die Erstellung langer Texte macht.

Diese Antwort stammt aus dem ArtikelTifa-Deepsex-14b-CoT: ein großes Modell, das sich auf Rollenspiele und die Erstellung ultralanger Fiktion spezialisiert hatDie

Darf nicht ohne Genehmigung vervielfältigt werden:KI-Produktivitätswerkzeuge " Tifa-Deepsex-14b-CoT ist ein parametrisches 14B-Makromodell, das für Rollenspiele und die Erstellung langer Geschichten optimiert ist.