OCRmyPDFはオープンソースのPythonベースのツールで、その主な機能は、Tesseract OCRエンジンを介してスキャンしたPDFファイルに検索可能でコピー可能なテキストレイヤーを追加することです。OCRmyPDFは、Linux、Windows、macOS、その他のオペレーティングシステム用の多言語認識をサポートしており、Dockerイメージを通してクロスプラットフォームで展開することができます。
この答えは記事から得たものである。OCRmyPDF: スキャンしたPDFをオープンソースツールの検索可能なテキストへについて