DeepSeek-TNG-R1T2-Chimeraとはどのようなモデルですか？前モデルとの違いは？

2025-08-23

1.8 K

モデルの定義とコアの違い

DeepSeek-TNG-R1T2-Chimeraは、ドイツのTNG Technology Consulting GmbHによって開発されたオープンソースの大規模言語モデルで、MITライセンスの下、Hugging Faceプラットフォーム上でホストされています。主な機能は以下の通りです：

マルチモデル・フュージョンアーキテクチャR1、V3-0324、R1-0528の3つの親モデルを専門家会議（Assembly of Experts）の手法で統合。
効率の最適化推論速度は20%がR1を上回り、R1-0528の2倍以上。
インテリジェント・エンハンスメントGPQAやAIME-24/25のようなベンチマークでより良いパフォーマンス

前モデルのDeepSeek-R1T-Chimeraと比較して、R1T2は主に以下の点が改良されている：