在Linux系统(以Ubuntu 22.04为例)上安装OCRmyPDF的步骤如下:
- 确保系统已安装Python 3和pip:
python3 --versionpip3 --version - 安装依赖项:
sudo apt updatesudo apt install tesseract-ocr ghostscript python3-pip pngquant - 使用pip安装OCRmyPDF:
pip3 install ocrmypdf - 验证安装:
ocrmypdf --version
如果显示版本号,说明安装成功。
本答案来源于文章《OCRmyPDF:将扫描PDF转为可搜索文本的开源工具》




























