Dockerを使ってOCRmyPDFを実行する手順は以下の通りです:
- Dockerがインストールされ、実行されていることを確認する:
docker run hello-world
- OCRmyPDF画像を取り出します:
docker pull jbarlow83/ocrmypdf
- 鏡に便利な名前をマークする:
docker tag jbarlow83/ocrmypdf ocrmypdf
- PDFファイルを処理するためにOCRmyPDFを実行してください:
docker run --rm -v $(pwd):/data ocrmypdf /data/input.pdf /data/output.pdf
このコマンドは、カレントディレクトリのinput.pdfを処理し、output.pdfに出力します。
Dockerのアプローチは、特にローカル環境のないシナリオに適しており、クロスプラットフォームの展開とOCRmyPDFの使用を実現します。
この答えは記事から得たものである。OCRmyPDF: スキャンしたPDFをオープンソースツールの検索可能なテキストへについて