Demucs v4作为里程碑版本,通过集成Hybrid Transformer架构实现了音轨分离技术的突破性进展。该技术将Transformer的自注意力机制与传统的卷积神经网络相结合,显著提升了特征提取能力,使分离精度达到业界领先水平。
具体实现包括:
- 支持六音轨分离:人声、鼓组、贝斯、其他伴奏、吉他及钢琴
- 模型选择差异:htdemucs_ft微调模型精度最高,htdemucs_6s支持六音轨实验性功能
- 处理时长优化:音频处理时间约为原时长1.5倍,相比v3版本效率提升30%
- 显存要求:推荐3GB以上GPU显存,可通过–segment参数优化资源占用
该版本特别适合专业音乐制作,可精确提取特定乐器音轨进行重混音创作。
本答案来源于文章《Demucs:免费分离音乐音轨的开源工具》