Requisitos do cenário acadêmico
Os pesquisadores geralmente precisam extrair fórmulas matemáticas de documentos digitalizados, e as ferramentas tradicionais de OCR têm uma taxa de reconhecimento inferior a 50% para fórmulas complexas.
Caminhos para a realização da tecnologia
- Detecção de área de fórmulaUnDatas.IO: o mecanismo de análise de layout do UnDatas.IO identifica fórmulas em linha/independentes
- reconhecimento multimodalCombinação de técnicas de reconhecimento de imagem e compreensão semântica para analisar a estrutura de fórmulas
- conversão de formato: Saída do código LaTeX padrão, mantendo o
fracsímbolo especial - correção de calibraçãoVerificação gramatical por meio do modelo Qwen-math (consulte o texto para ver um exemplo de solução de problemas de matemática)
exemplo de operação
Após fazer o upload do PDF do documento, ligue paraextract_component(type='formula')Interface para obter uma lista de fórmulas e definir parâmetrosoutput_format='latex'.. Para identificar fórmulas anômalas, usevisualize_bboxMétodos para verificar a precisão do posicionamento.
Essa resposta foi extraída do artigoUnDatas.IO: serviço de API para análise precisa de vários tipos de dados não estruturados (pago)O































