Overseas access: www.kdjingpai.com
Bookmark Us
Current Position:fig. beginning " AI Answers

CosyVoice的细粒度情感控制支持8类副语言学标记

2025-08-23 503

情感语音合成的工程创新

CosyVoice在语音合成领域首次实现了基于符号标记的实时情感控制,其Tokenizer模块预设了[laughter][cry][pause=200ms]等8类副语言学标签,支持50ms级精度的韵律调整。技术方案上采用多层次条件对抗训练:

  • 底层特征:使用Pitch-Contour预测网络建模情感韵律
  • 中层控制:通过Prosody-Tokens实现跨语种情感迁移
  • 上层应用:开放[style=happy]等语义级控制接口

实测数据显示,添加[laughter]标签可使合成语音的愉悦度评分提升42%,停顿标记误差小于±10ms。该功能已应用于游戏NPC对话系统,相比传统情感语音合成方案降低90%的标注成本。

Recommended

Can't find AI tools? Try here!

Just type in the keyword Accessibility Bing SearchYou can quickly find all the AI tools on this site.

Top

en_USEnglish