Procedure for use
- 准备WAV格式的音频文件
- 编写包含音频路径和问题的Python脚本
- invocations
audioreasoner_gen()
函数进行推理 - 查看结构化输出结果
sample code (computing)
audiopath = "assets/test.wav"
prompt = "这段音频的节奏感和拍子是怎样的?"
audioreasoner_gen(audiopath, prompt)
输出说明
模型会返回包含<THINK>
cap (a poem)<RESPONSE>
两部分的结果:<THINK>
包含详细的推理过程(计划、描述、推理、总结);<RESPONSE>
则是最终的简洁回答。
This answer comes from the articleAudio-Reasoner: a large-scale language model supporting audio deep reasoningThe