Das Verfahren von dots.ocr zur Bearbeitung von Formeln für wissenschaftliche Arbeiten sieht wie folgt aus:
- passieren (eine Rechnung oder Inspektion etc.)Layout-ErkennungSuchen Sie den Formelbereich im Dokument, um genaue Bounding-Box-Koordinaten zu erzeugen.
- ausnutzenModul zur Erkennung von InhaltenFormeln in das LaTeX-Format konvertieren, wobei die Genauigkeit der mathematischen Notation und Struktur erhalten bleibt.
- Im JSON-Ausgabeergebnis der
formula
Feld, um den LaTeX-Code zu speichern, während die Markdown-Datei mit dem$...$
Inline-Formeln bilden.
Um die Erkennungsrate zu verbessern, wird empfohlen, 1) sicherzustellen, dass die DPI des Eingabebildes ≥200 ist; 2) für dichte formelhafte Regionen kann dieprompt_grounding_ocr
mit manuell markierten Begrenzungsrahmen; 3) die Ausgabe auf aufeinanderfolgende Sonderzeichen überprüfen (z. B.___
) Ob eine Nachbearbeitungskorrektur erforderlich ist.
Diese Antwort stammt aus dem Artikeldots.ocr: ein vereinheitlichtes visuell-linguistisches Modell für die Analyse von mehrsprachigem DokumentenlayoutDie