Lösung: Guava Intelligent Document Recognition Tool verwenden
Für Szenarien, in denen Sie mit Dokumenten in einer Offline-Umgebung arbeiten müssen, können Sie die folgenden Schritte ausführen:
1. vorbereitende Arbeiten:
- Software-Installationspaket herunterladen (Chinesisch/Englisch)
- Installation der Tesseract OCR-Engine (Windows/Linux/Mac-Systeme werden unterschiedlich installiert)
- Konfigurieren von Systemumgebungsvariablen
2. das Verfahren zur Identifizierung der Dokumente:
- Importieren von Dateien: Unterstützung des JPG/PNG/PDF-Formats
- Erkennungsfunktion auswählen: OCR-Erkennung oder Formularerkennung
- Inhalt der Ausgabe bearbeiten: Der erkannte Textinhalt kann geändert werden.
- Ergebnisse speichern: Unterstützung der Formate txt/html/excel
3) Empfehlungen zur Leistungsoptimierung:
- Stellen Sie sicher, dass die Eingabedateien klar sind (300 DPI oder mehr)
- Schließen Sie andere ressourcenintensive Programme, bevor Sie große Dateien verarbeiten
- Regelmäßig aktualisierte Softwareversionen
Diese Antwort stammt aus dem ArtikelGuava Intelligent Document Recognition: Intelligentes Erkennungsprogramm für Offline-Dokumente und FormulareDie































