Die Innovation des Systems besteht in der Einführung eines Prompt-Steuermechanismus, der es dem Benutzer ermöglicht, durch einfache Änderung des Eingabebefehls den Verarbeitungsmodus zu wechseln. So wird beispielsweise bei Verwendung des Befehls prompt_layout_only_en nur die Layout-Analyse englischer Dokumente durchgeführt, während sich der Modus prompt_ocr auf die Textextraktion konzentriert und automatisch dekorative Inhalte filtert. Dieses Design kann die Zeit für den Aufgabenwechsel um mehr als 80% verkürzen, verglichen mit der traditionellen Methode, die ein Neuladen des Modells erfordert. Das System ist mit 7 professionellen Prompt-Vorlagen vordefiniert, die eine Vielzahl von Szenarien abdecken, vom vollständigen Parsing bis zur Extraktion bestimmter Elemente.
Diese Antwort stammt aus dem Artikeldots.ocr: ein vereinheitlichtes visuell-linguistisches Modell für die Analyse von mehrsprachigem DokumentenlayoutDie