DeepSeek-TNG-R1T2-Chimera: ドイツTNG社がDeepSeekの機能強化を発表
DeepSeek-TNG-R1T2-Chimeraは、TNG Technology Consulting GmbHによって開発され、Hugging Faceプラットフォーム上でホストされているオープンソースの大規模言語モデルです。このモデルは2025年7月2日にリリースされ、D...
ERNIE 4.5
ERNIE4.5は、PaddlePaddleフレームワークに基づいてBaiduによって開発されたオープンソースの大規模モデルファミリーであり、0.3Bから424Bパラメータまでの幅広いモデルをカバーし、テキスト処理、画像生成、マルチモーダルタスクをサポートする。このプロジェクトはGitHubでホストされており、Hugging Faceと組み合わせることで、...
Hunyuan-A13B: 超長文文脈と知的推論のための効率的なオープンソース大規模言語モデル
Hunyuan-A13Bは、Tencentのハイブリッドチームによって開発されたオープンソースの大規模言語モデルであり、Mixed Expert(MoE)アーキテクチャ設計に基づいている。Hunyuan-A13Bは256Kの超長文脈処理をサポートし、...
Qwen3をリリース:深く考え、素早く対応する新世代のビッグ・ランゲージ・モデル
大規模言語モデルの分野に新しい仲間が加わった。最近、大規模言語モデルのQwenファミリーが最新バージョンQwen3をリリースした。 開発チームによると、そのフラッグシップモデルであるQwen3-235B-A22Bは、コーディング能力、数学能力、汎用能力のベンチマークにおいて、DeepSeek-R1、o1、o3に匹敵することを示している。