解决CUDA显存不足的三种方法
CSM Voice Cloning依赖GPU进行模型推理,当本地显卡显存不足时会导致运行中断。以下是逐步解决方案:
- 方法一:缩短音频样本
将输入的音频样本剪辑至30秒-1分钟,显著降低显存占用量。推荐用Audacity等工具截取发音最清晰的部分。 - 方法二:切换到云端运行
通过Modal平台使用云端GPU:- 安装Modal客户端:
pip install modal
- 配置账户:
modal token new
- 运行云端脚本:
modal run modal_voice_cloning.py
- 安装Modal客户端:
- 方法三:调整模型参数
修改models.py中的max_seq_len参数降低到2048或1024,注意这可能影响长音频生成质量。
This answer comes from the articleCSM Voice Cloning: Fast Voice Cloning with the CSM-1BThe