Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

Tifa-Deepsex-14b-CoT ist ein parametrisches 14B-Makromodell, das für Rollenspiele und die Erstellung langer Geschichten optimiert ist.

2025-09-10 3.6 K

Tifa-Deepsex-14b-CoT ist ein speziell für große Sprachen optimiertes Modell, das auf der Deepseek-R1-14B-Architektur basiert und durch mehrstufiges Training und die 128k-Technologie zur Unterstützung ultralanger Kontexte zwei bahnbrechende Ergebnisse erzielt:

  • Verbesserung des RollenspielsDas Modell verwendet den 671B-Parameter-RL-Belohnungsalgorithmus, der das Problem löst, dass der ursprüngliche Modelldialogcharakter nicht passt. Durch die Verschmelzung von 10K manuellen Annotationen und 100K generativen SFT-Daten können mehrere Dialogrunden, die den Charaktereinstellungen entsprechen, genau generiert werden.
  • Optimierung der Erzeugung von LangformatenInkrementelles Pre-Training von 0,4T neuartigem Korpus und die Einführung eines Anti-Duplikations-DPO-Mechanismus, was zu einer Kohärenzverbesserung von 52% für Texte von 200.000 Wörtern oder mehr und einer Genauigkeitsrate von 98% bei der Korrektur von Chinesisch/Englisch-Verwechslungen führt.

Das Modell ist in drei quantisierten Versionen (F16/Q8/Q4) erhältlich und erreicht auf einer RTX4090-Grafikkarte eine Inferenzgeschwindigkeit von 18 Token pro Sekunde, was es zu einem der wenigen kommerziell einsetzbaren Modelle für die Erstellung langer Texte macht.

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang