R1-Omni简介与核心功能
R1-Omni是由HumanMLLM团队开发的开源多模态情感识别模型,基于HumanOmni-0.5B基础模型构建,创新性地结合了强化学习与可验证奖励(RLVR)技术。其核心功能包括:
- 多模态情感分析:通过同步处理视频画面和音频数据,识别愤怒、快乐、惊讶等情绪状态
- RLVR技术优化:采用强化学习方法提升模型在复杂场景下的推理能力和适应性
- 开源支持:提供完整的代码库和4种预训练模型(HumanOmni-0.5B/EMER-SFT等)下载
- 高性能表现:在DFEW、MAFW等基准测试集上展现卓越性能,如在DFEW(WAR)指标达65.83%
该项目特别适合情感计算、人机交互等领域的研究者,支持二次开发与定制化训练。
本答案来源于文章《R1-Omni:通过视频和音频分析情感的开源模型》