DeepSeek-TNG-R1T2-Chimera:德国 TNG 发布的 DeepSeek 增强版
DeepSeek-TNG-R1T2-Chimera 是由 TNG Technology Consulting GmbH 开发的一款开源大型语言模型,托管在 Hugging Face 平台上。该模型于 2025 年 7 月 2 日发布,是 D...
ERNIE 4.5
ERNIE 4.5 是由百度基于 PaddlePaddle 框架开发的开源大模型系列,涵盖从 0.3B 到 424B 参数的多种模型,支持文本处理、图像生成和多模态任务。项目托管在 GitHub 上,结合 Hugging Face 提供模型...
Hunyuan-A13B:高效开源大语言模型,支持超长上下文和智能推理
Hunyuan-A13B 是由腾讯混元团队开发的一款开源大语言模型,基于混合专家(MoE)架构设计。模型总参数量达 80 亿,其中 13 亿为活跃参数,兼顾高性能与低计算成本。Hunyuan-A13B 支持 256K 超长上下文处理,适用于...
Qwen3 发布:深入思考与快速响应并存的新一代大语言模型
大型语言模型领域迎来了新成员。近日, Qwen 系列大语言模型发布了其最新版本 Qwen3。据开发团队介绍,其旗舰模型 Qwen3-235B-A22B 在编码、数学及通用能力等基准测试中,展现出与 DeepSeek-R1 , o1 , o3...