视频情感分析操作指南
执行视频情感识别包含以下流程:
- 准备素材:确保视频为MP4格式,包含清晰画面和音频轨道
- 运行推理脚本:使用inference.py并指定参数:
--modal video_audio
--model_path /模型路径
--video_path 视频文件
--instruct "..." - 解析输出:结果包含<think>逻辑分析过程和<answer>最终情绪标签
典型应用场景指令示例:要求模型分析”视频中最明显的情绪”。输出会详细描述面部表情、语音特征等线索,最终给出如angry/happy等标签。对于批量处理,可编写循环脚本调用接口。
注意:首次运行需下载约10GB的预训练模型,建议保持网络畅通。
本答案来源于文章《R1-Omni:通过视频和音频分析情感的开源模型》