跨语言语音合成的过渡方案
虽然当前Muyan-TTS主要支持英语,但可通过以下方法实现可接受的中文输出:
- 间接生成方案:
- 使用机器翻译将中文文本转为英文
- 用Muyan-TTS生成英文语音
- 通过Voice Conversion(如so-vits-svc)转换音色
- 模型微调方案:
- 收集中文-英文平行语料(相同内容双语录音)
- 在现有模型基础上进行跨语言适配训练
- 重点调整SoVITS解码器的中文音素处理能力
- 混合系统方案:
- 使用Muyan-TTS处理英文段落
- 衔接其他中文TTS系统(如VITS)处理中文部分
- 后期统一调整音色参数
需要注意的是,这些方案在韵律自然度上可能有所妥协。对于专业级中文内容,建议等待官方支持或参与社区的多语言训练计划。当前可在生成后通过Adobe Audition等工具进行细微调整改善听感。
This answer comes from the articleMuyan-TTS: Personalized Podcast Speech Training and SynthesisThe