Auto-Audio-Book是由开发者zqq-nuli创建的Python 3.10+开源项目,托管在GitHub平台。该工具通过整合大模型技术(如Gemini和CosyVoice2-0.5B),实现了从网络爬取小说内容到生成多角色有声书的完整流程。项目代码完全公开,允许用户自由下载和修改,特别适合技术爱好者和有声书制作者使用。
核心架构包含五个关键技术模块:1)基于requests库的网络爬虫系统;2)运用NLP技术的对话分析引擎;3)多角色语音合成接口;4)基于ffmpeg的音频处理系统;5)可选MongoDB数据库支持。这种模块化设计使项目具有高度可扩展性,开发者可以轻松替换其中的组件。
截至2025年3月的最新版本(0.5B),该项目虽仍处于开发阶段且GUI尚未完善,但已能通过命令行完成从爬取到生成的全部工作流程。典型运行环境需要配备Python 3.10+、ffmpeg音频工具以及相应的大模型API密钥,这些在项目文档中都有明确说明。
Essa resposta foi extraída do artigoUma ferramenta para rastrear automaticamente romances e gerar audiolivros com vários caracteresO