海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI答疑

什么是 MiMo-7B 模型?它的核心能力是什么?

2025-08-23 1.4 K

MiMo-7B 模型简介

MiMo-7B 是小米公司开发的开源大语言模型系列,拥有 70 亿参数。该系列包含四个不同训练阶段的模型:

  • 基础模型 (Base):完成初始预训练的原始版本
  • 监督微调模型 (SFT):通过监督学习进行任务优化的版本
  • RL-Zero:直接从基础模型进行强化学习的版本
  • RL:从 SFT 模型进一步强化学习的最佳版本

核心能力主要体现在两大领域:

  1. 数学推理:可解决 AIME、MATH-500 等数学竞赛题目,支持复杂问题分步推理
  2. 代码生成:能够高质量生成 Python、C++ 等编程代码,适用于 LiveCodeBench 任务

该模型通过多重令牌预测 (MTP) 和强化学习优化,实现了与更大规模模型相当的推理能力。

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

回顶部

zh_CN简体中文