在Linux系统(以Ubuntu 22.04为例)上安装OCRmyPDF的步骤如下:
- 确保系统已安装Python 3和pip:
python3 --version
pip3 --version
- 安装依赖项:
sudo apt update
sudo apt install tesseract-ocr ghostscript python3-pip pngquant
- 使用pip安装OCRmyPDF:
pip3 install ocrmypdf
- 验证安装:
ocrmypdf --version
如果显示版本号,说明安装成功。
本答案来源于文章《OCRmyPDF:将扫描PDF转为可搜索文本的开源工具》