Análise do problema
AI生成人声常存在机械感强的问题。SongGen提供两种优化方案:
声音克隆方案
- pretender3秒干净人声样本(建议不含背景音乐)
- configurarseparate=True参数自动分离参考音频中的人声
- 模型会学习音色特征并迁移到新歌曲中
参数优化方案
- adaptardo_sample=True启用随机采样
- 适当增加生成时的temperatura参数(建议0.7-1.0)
- 在歌词文本中加入发音提示(如英文单词标注音标)
advertência
参考音频宜选择与目标歌曲情绪匹配的样本。
Essa resposta foi extraída do artigoSongGen: um transformador autorregressivo de estágio único para geração automática de músicasO