MiniMax Speech 2.5 的核心升级主要体现在三个方面:
- 多语种表现力增强:优化了中文普通话的生成效果,并提升了英语等主流语种的表现,解决了多语言场景下的“机械感”问题,提高了相似度和自然韵律度。
- 音色复刻精度提高:增强了对声音细节的捕捉能力,尤其在跨语种复刻和保留特定口音(如地区口音)等复杂场景下,实现了更高保真度的还原。例如,可以模仿特定演讲腔调,并在切换语言时保留原说话者的声音特质。
- 语种覆盖范围扩大:新增了对保加利亚语、丹麦语、希伯来语等小众语言的支持,总语种数量达到40个,为全球化内容部署提供了更多可能性。
本答案来源于文章《MiniMax 发布 Speech 2.5:语音合成技术在多语言与音色复刻上突破》