讯飞智作提供了完善的AI声音调参系统,支持从多个维度进行个性化调整:
基础参数调节
- 语速控制:50-200%的可调范围,适应不同内容类型(如广告快读/诗歌慢诵)
- 语调变化:±20%的音高调整,可营造严肃/活泼等不同语气
- 音量平衡:独立调节人声与背景音乐的比例
高级发音控制
- 多音字矫正:如”银行”的”行”字发音可通过拼音标注强制指定
- 数字读法:可设置”2024″读作”二零二四”或”两千零二十四”
- 英文处理:支持单词拼读(如A-P-P-L-E)或自然发音两种模式
特殊效果添加
通过插入情感标记(如[笑声][停顿3秒])和强调重音,可使语音更生动自然。平台还提供回声/电话音效等场景化声音滤镜。需要特别说明的是,每个AI主播的调参范围存在差异,新闻类主播的调节灵活性通常高于卡通类主播。
本答案来源于文章《讯飞智作:将文字转换成语音和数字人视频》