OCRmyPDFをLinuxシステム(例えばUbuntu 22.04)にインストールする手順は以下の通りです:
- Python 3とpipがシステムにインストールされていることを確認してください:
python3 --version
pip3 --version
- 依存関係をインストールします:
sudo apt update
sudo apt install tesseract-ocr ghostscript python3-pip pngquant
- pipを使ってOCRmyPDFをインストールしてください:
pip3 install ocrmypdf
- インストールを確認する:
ocrmypdf --version
バージョン番号が表示されていれば、インストールは成功です。
この答えは記事から得たものである。OCRmyPDF: スキャンしたPDFをオープンソースツールの検索可能なテキストへについて