ロングコンテクスト技術の導入
Jan-nano-128kは、革新的なYARN位置エンコーディング技術により、オリジナルのQwen3のコンテキストウィンドウを32kから128kトークンに拡張します。そのロープスケーリングパラメータは、40960以上の位置埋め込みを処理する際に、自動的に3.2倍の拡張係数を有効にする動的調整戦略を採用しています。この設計により、最大500ページのドキュメントを分析する際に、98%以上の主要情報抽出精度を維持することができます。
有価証券報告書分析の実用化において、このモデルはページ間のデータ相関に優れた理解力を示す。テストケースでは、上場企業のアニュアルレポートを80kトークンで入力した後、Jan-nano-128kは各事業セグメントの収益シェアの傾向を正確に要約することができ、従来のチャンキング処理手法を30%以上凌駕しています。
この答えは記事から得たものである。Jan-nano:軽量で効率的なテキスト生成モデルについて































