OCRmyPDF ist ein Open-Source-Befehlszeilen-Tool, dessen Kernfunktion darin besteht, der gescannten PDF-Datei eine OCR-Textebene hinzuzufügen, so dass sie zu einem durchsuchbaren, reproduzierbaren Dokument wird. Es basiert auf Python Entwicklung, die Verwendung von Tesseract OCR-Engine, kann genau den Text im Bild zu identifizieren und in der PDF eingebettet, unter Beibehaltung der ursprünglichen Dokument-Layout und Bildqualität.
Die wichtigsten Merkmale sind:
- Hinzufügen durchsuchbarer Textebenen zu gescannten PDF-Dateien mit Unterstützung für Kopieren und Einfügen
- Standardmäßige Erzeugung des PDF/A-Formats, das den Standards für die Langzeitarchivierung entspricht
- Unterstützt Texterkennung in 39 Sprachen
- Automatische Korrektur von Schräglage und Drehung der Seite
- Optimieren der PDF-Dateigröße
- Unterstützt parallele Verarbeitung mit mehreren Kernen zur Steigerung der Effizienz
- Debug-Modus zur Überprüfung der OCR-Ergebnisse bereitstellen
Diese Antwort stammt aus dem ArtikelOCRmyPDF: gescanntes PDF in durchsuchbaren Text des Open-Source-ToolsDie