海外からのアクセス：www.kdjingpai.com

Ctrl + D このサイトをブックマークする

現在の場所図頭 " AIアンサー

オープン-リーゾナー-ゼロのパフォーマンスのハイライトは？

2025-09-05

1.5 K

Open-Reasoner-Zero在性能方面有几个显著优势：

训练效率极高：项目采用创新算法，用不到 DeepSeek-R1-Zero 1/30 的训练步骤，就达到了相似的性能水平
GPU利用率高GPUを最大限に活用するために、1つのコントローラでトレーニングと生成をサポートします。
高性能モデルのサポート：基于 Qwen2.5 模型（7B 和 32B 参数版本），提供优异的推理性能
资源完整开源：提供57k条高质量训练数据、完整源代码和预训练权重
基准测试表现优秀：在GPQA Diamond等基准测试中展现出强大的推理能力

这些亮点使得Open-Reasoner-Zero在强化学习研究领域具有独特优势，既适合快速验证新想法，也能支持大规模的长期研究项目。

この答えは記事から得たものである。Open-Reasoner-Zero：オープンソースの大規模推論強化学習トレーニングプラットフォームについて

無断転載を禁じます：AI生産性ツール " オープン-リーゾナー-ゼロのパフォーマンスのハイライトは？

おすすめ