DeepCoder-14B-Preview是由Agentica团队基于DeepSeek-R1-Distilled-Qwen-14B模型开发的开源代码生成工具。该模型通过先进的分布式强化学习(RL)技术进行优化,显著提升了代码生成的准确率和上下文处理能力。核心技术采用GRPO+和DAPO算法优化长序列建模,支持64K token的超长上下文窗口,是目前开源模型中最强大的代码生成器之一。
相较于基础模型,其性能提升主要体现在:
- LiveCodeBench v5测试中Pass@1准确率达到60.6%
- 相比原始模型提升8%的性能
- 接近OpenAI o3-mini的商业模型水平
全面开源的特性包括:模型权重、训练数据集、完整训练脚本,使开发者可以自由使用和二次开发。
Diese Antwort stammt aus dem ArtikelDeepCoder-14B-Preview: ein Open-Source-Modell, das sich bei der Codegenerierung auszeichnetDie