Overseas access: www.kdjingpai.com
Bookmark Us
Current Position:fig. beginning " AI Answers

VOP支持哪些语言文本的识别?如何扩展新的语言支持?

2025-08-25 1.2 K

VOP当前具备以下语言处理能力:

内置支持语言

  • 基础语言包:英语(eng)、日语(jpn)、韩语(kor)
  • 混合识别: By--lang eng+jpn参数可同时处理双语文档

扩展新语言步骤

  1. 安装对应Tesseract语言包(如中文:sudo apt install tesseract-ocr-chi-sim)
  2. compilerconfig/languages.json添加配置项:
    "chi": {
    "tesseract_code": "chi_sim",
    "google_vision_code": "zh"
    }
  3. 重新启动程序并指定语言参数:
    --lang chi+eng

Caveats:
• 新语言需测试识别精度,复杂布局文档可能需调整YOLO模型参数
• 非拉丁语系语言(如阿拉伯语)需要额外配置文字方向检测
• 推荐优先使用Google Vision API(支持200+语言),但其对公式/表格的识别精度可能降低

Recommended

Can't find AI tools? Try here!

Just type in the keyword Accessibility Bing SearchYou can quickly find all the AI tools on this site.

Top

en_USEnglish