DeepCoder-14B-Preview 简介
DeepCoder-14B-Preview 是由 Agentica 团队开发的一款开源代码生成模型,发布在 Hugging Face 平台。它是基于 DeepSeek-R1-Distilled-Qwen-14B 进行优化,采用了分布式强化学习(RL)技术。这个模型的主要目标是为开发者提供高效的代码生成能力,特别适合编程竞赛和大型项目开发。
主要特点
- 生成长代码:支持最高 64K token 的上下文,能生成和处理超长代码
- 高准确率输出:在 LiveCodeBench v5 测试中达到了 60.6% Pass@1 准确率
- 完全开源:提供完整的模型权重、训练数据和脚本
- 多编程任务支持:适用于竞赛题目解答、代码调试和项目开发
- 优化的长上下文推理:通过 GRPO+ 和 DAPO 技术确保长代码生成能力
这个模型拥有 140 亿参数,性能接近 OpenAI 的 o3-mini,是当前开源代码生成模型中的佼佼者。
本答案来源于文章《DeepCoder-14B-Preview:擅长代码生成的的开源模型》