Seed Diffusion 在多个权威代码评测基准中展现出卓越的性能:
- 在LiveCodeBench、Bigcode Bench、Mbpp和Human Eval等基准测试中,其性能与同规模自回归模型相当
- 在代码编辑任务中,由于扩散模型的全局视角特性,其表现优于传统自回归模型
- 特别擅长处理需要结构化推理的任务,如变量重命名、函数重构等,能确保修改的全局一致性
这主要得益于其两阶段训练机制:先通过掩码扩散训练学习代码补全能力,再通过编辑扩散训练提升全局合理性。
本答案来源于文章《Seed Diffusion:验证新一代架构的高速语言模型》