Implementierung von Technologie im langen Kontext
Jan-nano-128k erweitert das Kontextfenster des ursprünglichen Qwen3 von 32k auf 128k Token durch eine innovative YARN-Positionskodierungstechnik. Der Seil-Skalierungsparameter verwendet eine dynamische Abstimmungsstrategie, die automatisch einen 3,2-fachen Erweiterungsfaktor aktiviert, wenn mehr als 40960 Positionseinbettungen verarbeitet werden. Dieses Design stellt sicher, dass das Modell die Genauigkeit der Extraktion von Schlüsselinformationen von mehr als 98% beibehält, wenn es Dokumente mit einem Umfang von bis zu 500 Seiten analysiert.
In der praktischen Anwendung der Finanzberichtsanalyse zeigt das Modell ein ausgezeichnetes Verständnis der seitenübergreifenden Datenkorrelation. Der Testfall zeigt, dass Jan-nano-128k nach Eingabe der Jahresberichte börsennotierter Unternehmen mit 80k Token in der Lage ist, den Trend des Umsatzanteils jedes Geschäftssegments genau zusammenzufassen, was die traditionelle Chunking-Verarbeitungsmethode um mehr als 30% übertrifft.
Diese Antwort stammt aus dem ArtikelJan-nano: ein leichtes und effizientes Modell für die TexterstellungDie































