对于无本地环境的用户,最便捷的解决方案是使用Docker容器:
- 基本步骤:
- 安装Docker后运行测试命令
docker run hello-world
- 获取镜像:
docker pull jbarlow83/ocrmypdf
- 简化使用:
docker tag jbarlow83/ocrmypdf ocrmypdf
- 安装Docker后运行测试命令
- 典型使用命令:
docker run --rm -v $(pwd):/data ocrmypdf /data/input.pdf /data/output.pdf -l eng
- 批量处理方案:编写Shell脚本结合docker命令实现自动化
- 云端部署:可在AWS/Azure等云平台部署容器化实例
此方法无需处理复杂的本地依赖,特别适合企业IT环境中的快速部署和使用。
本答案来源于文章《OCRmyPDF:将扫描PDF转为可搜索文本的开源工具》