中文TTS特殊挑战
中文存在多音字、儿化音等复杂发音规则。虽然当前版本对中文支持仍在完善中,但可通过以下方案提升准确性:
prescrição
- Pré-processamento de texto: Integração
pypinyin
库强制标注多音字(如「银行」→ yin hang) - 韵律标记:在输入文本插入SSML标签控制停顿(
<break time="200ms"/>
) - 私有化训练:使用开源工具包
chinese-tts-finetune
微调ONNX模型 - 后处理矫正: através de
FFmpeg
(usado em uma expressão nominal)atempo
滤镜调整异常语速片段
Programa alternativo provisório
若急需生产级中文TTS,建议:1) 等待官方v1.0中文模型 2) 组合使用Bert-VITS2
进行前端文本分析 3) 对接阿里云/讯飞API作fallback
Essa resposta foi extraída do artigoKokoro-ONNX: ferramenta eficiente de conversão de texto em fala com suporte a vários idiomas e várias vozesO