VOP当前具备以下语言处理能力:
内置支持语言
- 基础语言包:英语(eng)、日语(jpn)、韩语(kor)
- 混合识别: através de
--lang eng+jpn
参数可同时处理双语文档
扩展新语言步骤
- 安装对应Tesseract语言包(如中文:
sudo apt install tesseract-ocr-chi-sim
) - compilador
config/languages.json
添加配置项:"chi": {
"tesseract_code": "chi_sim",
"google_vision_code": "zh"
} - 重新启动程序并指定语言参数:
--lang chi+eng
Advertências:
• 新语言需测试识别精度,复杂布局文档可能需调整YOLO模型参数
• 非拉丁语系语言(如阿拉伯语)需要额外配置文字方向检测
• 推荐优先使用Google Vision API(支持200+语言),但其对公式/表格的识别精度可能降低
Essa resposta foi extraída do artigoVOP: ferramenta de OCR para extração de diagramas complexos e fórmulas matemáticasO