OCRmyPDFはページ修正と最適化の機能を提供し、それは以下のコマンドで実現できます:
- 自動ページスキュー補正:
ocrmypdf --deskew input.pdf output.pdf
- 自動的にページが回転します:
ocrmypdf --rotate-pages input.pdf output.pdf
可--rotate-pages-threshold
回転のしきい値を設定する。 - 長期保存に最適なPDF/Aフォーマットを生成:
ocrmypdf --output-type pdfa input.pdf output.pdf
- PDFファイルサイズの最適化
利用する--optimize 1
または、JBIG2エンコーダーをインストールして、ファイルサイズをさらに圧縮する。
これらの機能は、スキャン文書の可読性と保存品質を大幅に向上させる。
この答えは記事から得たものである。OCRmyPDF: スキャンしたPDFをオープンソースツールの検索可能なテキストへについて