API容错处理方案
为确保长期稳定运行,建议采用以下保障措施:
- 多API冗余:
- 在
config/
中配置Google Vision和MathPix的备用密钥 - 通过
--fallback_api mathpix:3,google:2
设置失败重试次数
- 在
- 本地缓存:
- 启用
--cache_dir ./api_cache/
自动存储已识别内容 - 添加
--cache_ttl 86400
设置1天缓存有效期
- 启用
- 流量控制:
- 使用
--rate_limit 50/分钟
避免触发API限制 - 对万页以上文档添加
--sleep_interval 1.2
秒延迟
- 使用
- 断点续传:
- 阶段1处理中断后可用
--resume_from temp/last_processed.page
恢复 - 通过
--checkpoint_interval 20
每20页保存进度
- 阶段1处理中断后可用
紧急方案:当API不可用时,可切换至纯本地模式--local_only
,但公式识别准确率会下降15-20%。
本答案来源于文章《VOP:提取复杂图表与数学公式的OCR工具》