Auto-Audio-Book的创新之处在于其智能角色识别与声音分配系统。首先使用AI模型分析小说文本,准确区分角色对话和旁白内容;然后根据特定规则分配声音特征:主要角色(台词超过50句)分配独立声线,次要角色复用旁白声音,未指定角色则随机匹配合成语音。
该功能通过两个核心技术实现:1)CosyVoice2-0.5B等语音合成模型的多声线支持;2)自定义的声音映射配置系统。用户可以手动指定主角和旁白的声线特征,包括性别、语速和音调等参数。项目文档提供了详细的声音配置案例,比如中文男声主角配合女声旁白的经典组合。
测试数据显示,多线程环境下该系统每小时可处理400章内容。相比传统单声线TTS系统,这种多角色方案使有声书的戏剧表现力提升显著,特别适合对话体小说的音频转化,生成的MP3文件可直接用于广播剧制作或在线平台发布。
本答案来源于文章《自动爬取小说并生成多角色有声书的工具》