在2024年8月至2025年2月的LiveCodeBench v5权威测试中,DeepCoder-14B-Preview取得了突破性的60.6% Pass@1准确率。这个成绩代表:
- 相比基础模型提升8%的性能
- 接近OpenAI o3-mini等商用模型的水平
- 在开源模型中位居前三
测试涵盖的评估维度包括:
- 算法题解的正确性(如动态规划、图论)
- 代码规范符合度(PEP8等标准)
- 边界条件处理能力
- 异常场景覆盖度
该成绩表明模型已具备实际工程应用价值,特别适合编程竞赛和教学场景的需求。
This answer comes from the articleDeepCoder-14B-Preview: an open source model that specializes in code generationThe