学术场景需求
研究人员常需要从扫描版论文中提取数学公式,传统OCR工具对复杂公式识别率不足50%。
Technology realization path
- 公式区域检测:UnDatas.IO的布局分析引擎能精准定位行内/独立公式
- 多模态识别:结合图像识别和语义理解技术解析公式结构
- format conversion:输出标准LaTeX代码,保留
frac
等特殊符号 - 校验修正:通过Qwen-math模型进行语法校验(参考文中数学问题解决示例)
Example of operation
上传论文PDF后,调用extract_component(type='formula')
接口获取公式列表,设置参数output_format='latex'
。对于识别异常公式,可使用visualize_bbox
方法检查定位准确性。
This answer comes from the articleUnDatas.IO: API service for accurate parsing of various types of unstructured data (paid)The