海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI答疑

Light-R1开源项目包含完整的训练数据和评估体系

2025-08-30 1.1 K

Light-R1项目在GitHub和HuggingFace平台开源了所有核心技术资产:包括经过严格去污染的76k+3k SFT数据集、DPO偏好数据集、基于360-LLaMA-Factory的完整训练脚本,以及DeepScaleR评估系统。技术文档详细记载了从数据清洗、模型训练到性能评估的全流程方法,特别是公开了确保评测公正性的数据过滤标准。

项目的评估体系包含AIME24/25、MATH-500等多个数学基准测试,其中集成的自动评分工具能精确分析模型在各类题目上的表现差异。所有资源均采用Apache 2.0开源协议,用户可自由用于商业或研究目的。这种全栈开源策略大大降低了领域内研究门槛,已有团队基于该项目成功复现了物理推理模型的训练过程。

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

回顶部

zh_CN简体中文