Higgs Audio是由Boson AI开发的开源文本转语音(TTS)项目,专为生成高质量、情感丰富的语音和多角色对话而设计。其核心特点包括:
- 创新架构:采用Dual-FFN架构和统一音频分词器技术
- 海量数据训练:基于超过1000万小时的音频数据
- desempenho líder:在EmergentTTS-Eval基准测试中情感表达胜率达75.7%
主要功能亮点:
- 自然语音生成支持多种情感语调
- 逼真的多角色对话模拟能力
- 无需训练的零样本语音克隆技术
- 多语言支持(中/英/德/韩等)
- 独特的语音与音乐融合功能
Essa resposta foi extraída do artigoHiggs Audio: uma ferramenta de código aberto para gerar fala de alta qualidade e diálogo com vários caracteresO