内容完整性保障体系
应对章节丢失的三重防护:
- 事前检查::
- (of a computer) run
python app/check_chapters.py验证爬取完整性 - exist
logs/crawl.log中检索ERROR标记
- (of a computer) run
- process monitoring::
- 启用章节校验功能(设置
VERIFY_CHAPTER=True) - utilization
watch -n 60 "ls -l output/ | wc -l"实时监控生成进度
- 启用章节校验功能(设置
- 事后补救::
- 单独重跑缺失章节:
python app/createAudio.py --chapter 42 - 从MongoDB恢复数据(需先安装配置):
python app/db_recover.py
- 单独重跑缺失章节:
开发建议:定期备份data/books/目录下的JSON中间文件,当使用云服务时建议启用S3自动同步。
This answer comes from the articleTool to automatically crawl novels and generate multi-character audiobooksThe































