怎样提升CSM Voice Cloning生成语音的相似度？

2025-08-29

1.3 K

优化声音相似度的完整方案

虽然CSM-1B模型无法做到完全拟真，但通过以下方法可显著改善相似度：

音频样本准备
录制3分钟纯净人声，建议：
1. 在安静环境使用专业麦克风
2. 包含自然说话的起伏和停顿
3. 避免背景音乐和杂音
参数调整策略
修改voice_clone.py：
- 增加num_repetitions次数（默认3可改为5）
- 调试temperature参数（0.7-1.2之间尝试）
Técnicas de pós-processamento
使用Audacity对输出音频：
1. 调整EQ匹配原声频率
2. 添加轻微混响增强真实感
3. 用Noise Reduction消除模型生成杂音