Für strukturierte Dokumente, wie z.B. Finanzberichte, bietet dots.ocr die folgenden speziellen Funktionen:
- Hochpräzise TabellenextraktionKonvertieren Sie komplexe Tabellen in Jahresabschlüssen in das HTML-Format, wobei die Zeilen- und Spaltenstruktur sowie die Datenbeziehungen für den direkten Import in Datenanalysetools erhalten bleiben.
- synergetisches Parsing von mehreren ElementenDie Software erkennt gleichzeitig textliche Beschreibungen, numerische Inhalte und zugehörige grafische Elemente, wobei die semantische Relevanz des Originaldokuments durch die JSON-Ausgabe erhalten bleibt.
- Optimierung der LesereihenfolgeAutomatisches Korrigieren der Reihenfolge von Elementen in einer seitenübergreifenden Tabelle oder einem Spaltenlayout, um sicherzustellen, dass die Ausgabe der menschlichen Leselogik entspricht.
In der Praxis kann der Benutzer die--prompt prompt_ocr
um Störungen in Kopf- und Fußzeilen auszuschließen, oder verwenden Sie den Parameter--bbox
Die Parameter werden für bestimmte Regionen genau geparst.
Diese Antwort stammt aus dem Artikeldots.ocr: ein vereinheitlichtes visuell-linguistisches Modell für die Analyse von mehrsprachigem DokumentenlayoutDie