多语言发音优化方案
针对中英混合场景:
- 文本预处理规范:必须使用
<|TEXT_UNDERSTANDING_START|>
标记包裹原文,模型会据此自动识别语言 - 混合编码策略:模型内部采用统一音节表征,通过共享的subword tokenizer处理多语言文本
- 发音校正技巧:对于特殊发音,可在文本中添加注音标记(如中文拼音/英文音标)
实测建议:1)英文专有名词首字母大写;2)中英混排时用空格分隔;3)未来8B版本将显著提升小语种表现。
This answer comes from the articleLlasa 1~8B: an open source text-to-speech model for high quality speech generation and cloningThe