VOP verfügt derzeit über die folgenden Sprachverarbeitungsfunktionen:
Integrierte Unterstützung für Sprachen
- Basis-SprachpaketEnglisch (eng), Japanisch (jpn), Koreanisch (kor)
- Hybriderkennung: durch
--lang eng+jpnParameter für die gleichzeitige Verarbeitung von zweisprachigen Dokumenten
Erweiterung der neuen Sprachstufen
- Installieren Sie die entsprechenden Tesseract-Sprachpakete (z. B. Chinesisch):
sudo apt install tesseract-ocr-chi-sim) - Compiler
config/languages.jsonFügen Sie einen Konfigurationspunkt hinzu:"chi": {
"tesseract_code": "chi_sim",
"google_vision_code": "zh"
} - Starten Sie das Programm neu und geben Sie die Sprachparameter an:
--lang chi+eng
Vorbehalte:
- Neue Sprachen müssen auf ihre Erkennungsgenauigkeit getestet werden, und komplexe Layout-Dokumente erfordern möglicherweise eine Anpassung der YOLO-Modellparameter.
- Nicht lateinische Sprachen (z. B. Arabisch) erfordern eine zusätzliche Konfiguration für die Erkennung der Textrichtung.
- Es wird empfohlen, vorzugsweise Google Vision API zu verwenden (mehr als 200 Sprachen werden unterstützt), aber die Erkennungsgenauigkeit für Formeln/Tabellen ist möglicherweise geringer.
Diese Antwort stammt aus dem ArtikelVOP: OCR-Tool zum Extrahieren komplexer Diagramme und mathematischer FormelnDie
































