当处理图表/示意图时(使用--mode figure
参数),VOP会生成多层级的智能分析结果:
1. 基础元素识别
- 图表类型判断:自动区分折线图、柱状图、流程图等
- 关键数据点提取:捕捉坐标轴数值范围、图例说明等
2. 语义化描述
典型输出示例:
• “展示2010-2020年全球气温变化的折线图,含三条不同地区的趋势线”
• “细胞有丝分裂的示意图,标注有前期、中期、后期、末期四个阶段”
3. 结构化数据
JSON输出包含以下字段:{
"type": "scatter_plot",
"x-axis": {"label": "Year", "range": [2000,2020]},
"series": [{"name": "Tokyo", "data": [...]}]
"description": "..."
}
该功能特别适用于构建AI训练数据集,如将生物学教材中的示意图转化为标注数据。
This answer comes from the articleVOP: OCR Tool for Extracting Complex Diagrams and Math FormulasThe