Für die Digitalisierungsanforderungen alter Dokumente hat PDF Craft ein spezielles Vorverarbeitungsmodul entwickelt. Das System kann das Scannen von alten Büchern automatisch korrigieren (Unterstützung von ± 15 Grad automatischer Korrektur), gelbe und braune Hintergründe behandeln (mit HSV-Farbraum-Entrauschung), vertikalen Text erkennen (Genauigkeitsrate von 86%). Testdaten zeigen, dass für die vor dem 19. Jahrhundert Englisch alten Bücher, die Konvertierung Genauigkeit im Bereich von 85-90%, die chinesische kanonische Bücher aufgrund der hohen Komplexität des Schriftsatzes ist bei 75-80% beibehalten. Tools bieten auch Stapelverarbeitung Modus, Unterstützung für die gleichzeitige Umwandlung von mehr als 2.000 Seiten einer großen Sammlung von Dokumenten, mit dem externen Wörterbuch-Funktion kann in bestimmten Bereichen der Terminologie Erkennungsrate 15% verbessert werden. diese Funktionen haben es eine beliebte Wahl für Bibliotheken, Archiven und anderen Institutionen gemacht. Diese Eigenschaften machen es zu einem der bevorzugten Werkzeuge für die Digitalisierung des kulturellen Erbes in Bibliotheken und Archiveinrichtungen.
Diese Antwort stammt aus dem ArtikelPDF Craft: Gescannte PDF-Dokumente in Markdown umwandeln Open-Source-ToolsDie































