OCRmyPDF bietet Funktionen zur Seitenkorrektur und -optimierung, die mit den folgenden Befehlen ausgeführt werden können:
- Automatische Korrektur des Seitenversatzes:
ocrmypdf --deskew input.pdf output.pdf
- Automatisches Drehen der Seiten:
ocrmypdf --rotate-pages input.pdf output.pdf
passabel--rotate-pages-threshold
Legt den Schwellenwert für die Rotation fest. - Generieren Sie das PDF/A-Format, um die Langzeitarchivierung zu optimieren:
ocrmypdf --output-type pdfa input.pdf output.pdf
- Optimieren Sie die Größe von PDF-Dateien:
ausnutzen--optimize 1
Oder installieren Sie den JBIG2-Encoder, um die Dateigröße weiter zu komprimieren.
Diese Funktionen können die Lesbarkeit und Archivierungsqualität von gescannten Dokumenten erheblich verbessern.
Diese Antwort stammt aus dem ArtikelOCRmyPDF: gescanntes PDF in durchsuchbaren Text des Open-Source-ToolsDie