KittenTTS 设计支持多种高质量的预设语音风格,用户可通过简单的 voice
参数选择不同的声音类型,例如清晰的男声(male_clear
)或柔和的女生(female_soft
)等。这些预设语音经过优化,能够满足不同应用场景的需求。虽然当前版本主要针对英语语音生成,但开发者可以通过文本标点符号(如逗号、感叹号)来间接调整语音的节奏和停顿效果,提升语音的自然度。
Essa resposta foi extraída do artigoKittenTTS: um modelo leve de conversão de texto em falaO