低配置设备运行AudioX的变通方案
针对没有高端GPU的用户,可采用以下方法顺利使用AudioX:
- 1. 降低生成质量换取速度:修改generate_diffusion_cond函数的steps参数(默认250步可减至150步),虽然音质会轻微下降但速度提升40%
- 2. 使用云服务替代:推荐Colab Pro或AWS EC2 g4dn.xlarge实例,按小时计费成本可控
- 3. 分段处理长音频:将10分钟音频分成6个100秒片段分别生成后拼接,避免显存溢出
- 4. 启用CPU优化模式:在conda环境中安装Intel MKL数学库,可提升CPU运算效率30%
实测显示:MacBook Pro M1芯片通过conda安装正确依赖后,生成20秒音频约需3分钟,完全可以接受。
本答案来源于文章《AudioX:参考文本、图像、视频生成音频和音乐》