O processo do dots.ocr para processar fórmulas de trabalhos acadêmicos é o seguinte:
- aprovar (um projeto de lei ou inspeção etc.)Detecção de layoutLocalize a área da fórmula no documento para gerar coordenadas precisas da caixa delimitadora.
- fazer uso deMódulo de reconhecimento de conteúdoConverta fórmulas para o formato LaTeX, mantendo a precisão da notação e da estrutura matemática.
- No resultado de saída JSON do
formula
para armazenar o código LaTeX, enquanto o arquivo Markdown começará com o campo$...$
Formular fórmulas inline.
Para melhorar a taxa de reconhecimento, recomenda-se: 1) garantir que o DPI da imagem de entrada seja ≥200; 2) para regiões com fórmulas densas, usar oprompt_grounding_ocr
com rotulagem manual das caixas delimitadoras; 3) verificar se há caracteres especiais consecutivos na saída (por exemplo___
) Se a correção pós-processamento é necessária.
Essa resposta foi extraída do artigodots.ocr: um modelo visual-linguístico unificado para análise de layout de documentos multilínguesO