双语混合合成的质量控制方法
确保中英文混合语音自然流畅的关键措施:
- 文本预处理:
- 中英文间添加空格(”测试test”→”测试 test”)
- 长复合词使用连字符(”COVID-19″而非”COVID19″)
- 参考音频选择:
- 使用包含双语内容的样本(中英文各占50%)
- 优先选择发音人的母语为双语者
- 参数组合优化:
- set up
--p_w=1.5
平衡口音特征 - raise
--t_w
至3.5增强音色连续性
- set up
- 后期校验:
- 使用Aligner子模块检查音素边界
- 通过WaveVAE重合成问题片段
对于专业领域内容,建议预先建立发音词典。遇到持续性问题时可尝试分段合成后拼接。
This answer comes from the articleMegaTTS3: A Lightweight Model for Synthesizing Chinese and English SpeechThe