使用步骤
- 准备WAV格式的音频文件
- 编写包含音频路径和问题的Python脚本
- 调用
audioreasoner_gen()
函数进行推理 - 查看结构化输出结果
示例代码
audiopath = "assets/test.wav"
prompt = "这段音频的节奏感和拍子是怎样的?"
audioreasoner_gen(audiopath, prompt)
输出说明
模型会返回包含<THINK>
和<RESPONSE>
两部分的结果:<THINK>
包含详细的推理过程(计划、描述、推理、总结);<RESPONSE>
则是最终的简洁回答。
本答案来源于文章《Audio-Reasoner:支持音频深度推理的大型语言模型》