OCRmyPDF提供了页面校正和优化的功能,可通过以下命令实现:
- 自动校正页面倾斜:
ocrmypdf --deskew input.pdf output.pdf
- 自动旋转页面:
ocrmypdf --rotate-pages input.pdf output.pdf
可通过--rotate-pages-threshold
设置旋转阈值。 - 生成PDF/A格式以优化长期存档:
ocrmypdf --output-type pdfa input.pdf output.pdf
- 优化PDF文件大小:
使用--optimize 1
或安装JBIG2编码器以进一步压缩文件大小。
这些功能可以显著提升扫描文档的可读性和存档质量。
本答案来源于文章《OCRmyPDF:将扫描PDF转为可搜索文本的开源工具》