工具通过多阶段技术实现角色声音区分:
角色识别阶段
- うごきだす
saveBookJson.py
脚本,利用AI模型分析章节内容,标记对话所属角色。 - 输出JSON文件记录角色对话的对应关系。
声音分配策略
- 手动指定主要角色声音:通过
createUser.py
设置主角和旁白的固定音色。 - 智能分配次要角色:台词超过50句的角色分配独立声音,少于50句则使用旁白音色。
- 支持CosyVoice2等模型的多种音色库选择。
実現
最终生成的MP3文件会呈现类似广播剧的听觉效果,不同角色拥有辨识度高的声音特征,如测试案例中主角使用低沉男声,旁白采用温和女声。
この答えは記事から得たものである。小説を自動的にクロールし、多文字のオーディオブックを生成するツールについて