Das System erzeugt drei Arten von standardisierten Ausgaben für jedes Parsing: ISO-konforme JSON-Dateien mit vollständigen Aufzeichnungen der Koordinaten, Typen und Inhalte aller Elemente; Markdown-Dokumente, die für die Lesereihenfolge optimiert sind und die ursprüngliche Layout-Logik beibehalten; und visuelle Annotationsdiagramme, die Elementkategorien mit verschiedenen Farben unterscheiden. Für die JSON-Ausgabe wird die Technologie der Blockkomprimierung verwendet, die das Indexvolumen eines millionenseitigen Dokuments um 70% reduziert. Die Benutzer können den nohf-Modus aktivieren, um Kopf- und Fußzeilen und andere Zusatzinformationen automatisch zu filtern, oder den bbox-Parameter verwenden, um eine genaue Extraktion des angegebenen Bereichs zu erreichen, um die vielfältigen Anforderungen der digitalen Verwaltung von Dokumenten zu erfüllen.
Diese Antwort stammt aus dem Artikeldots.ocr: ein vereinheitlichtes visuell-linguistisches Modell für die Analyse von mehrsprachigem DokumentenlayoutDie