Qualitätsstandards und Optimierungsempfehlungen für Eingabedokumente
OCRFlux hat klare Qualitätsanforderungen für Eingabedokumente, wobei 300 DPI der beste Standard ist. Diese Anforderungen beruhen auf den Grundlagen der optischen Zeichenerkennung:
- 300 Punkte pro Zoll gewährleisten die Lesbarkeit der 12pt-Schrift
- Genaue Erkennung komplexer Formular-Wireframes
- Ausreichend detaillierte Merkmale für Formelsymbole bereitstellen
Für Dokumente, die die Kriterien nicht erfüllen, werden die folgenden Optimierungsmaßnahmen empfohlen:
- Verwenden Sie einen professionellen Scanner statt eines Mobiltelefons zum Fotografieren
- Stellen Sie den Kontrast so ein, dass sich der Text vom Hintergrund abhebt.
- Geometrische Korrektur von schiefen Seiten
Praktische Tests haben gezeigt, dass die Aufwertung von 150DPI-Dokumenten auf 300DPI die Erkennungsgenauigkeit um 25-30% verbessern kann, was insbesondere für die Digitalisierung älterer Dokumente entscheidend ist.
Diese Antwort stammt aus dem ArtikelOCRFlux: Leichtes Tool zur Konvertierung von PDFs und Bildern in MarkdownDie