改善机械音需综合运用Podever工具的高级功能:
- 预处理文本:在输入PDF/URL时添加
--preprocess参数启用智能断句,避免生硬停顿。建议手动插入SSML标签控制语速,例如<prosody rate=’slow’> - 双人角色分配:在配置文件中定义
speaker_roles(如主持人/嘉宾),系统会自动分配不同语调 - 后处理增强:使用
podever.py的--post_filter选项应用预置的语音增强算法,消除爆破音 - 示例引导:提供30秒以上的参考音频(
--reference_audio),模型会模仿其抑扬顿挫
本答案来源于文章《MOSS-TTSD:开源的双语对话语音生成工具》




























