Zugang aus Übersee: www.kdjingpai.com
Ctrl + D Lesezeichen für diese Seite
Derzeitige Position:Abb. Anfang " AI-Antworten

DeepCoder-14B-Preview是通过分布式强化学习技术优化的开源代码生成模型

2025-08-25 1.2 K

DeepCoder-14B-Preview是由Agentica团队基于DeepSeek-R1-Distilled-Qwen-14B模型开发的开源代码生成工具。该模型通过先进的分布式强化学习(RL)技术进行优化,显著提升了代码生成的准确率和上下文处理能力。核心技术采用GRPO+和DAPO算法优化长序列建模,支持64K token的超长上下文窗口,是目前开源模型中最强大的代码生成器之一。

相较于基础模型,其性能提升主要体现在:

  • LiveCodeBench v5测试中Pass@1准确率达到60.6%
  • 相比原始模型提升8%的性能
  • 接近OpenAI o3-mini的商业模型水平

全面开源的特性包括:模型权重、训练数据集、完整训练脚本,使开发者可以自由使用和二次开发。

Empfohlen

Sie können keine AI-Tools finden? Versuchen Sie es hier!

Geben Sie einfach das Schlüsselwort Barrierefreiheit Bing-SucheDer Bereich KI-Tools auf dieser Website bietet eine schnelle und einfache Möglichkeit, alle KI-Tools auf dieser Website zu finden.

zurück zum Anfang

de_DEDeutsch