海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI答疑

VOP支持哪些语言文本的识别?如何扩展新的语言支持?

2025-08-25 1.1 K

VOP当前具备以下语言处理能力:

内置支持语言

  • 基础语言包:英语(eng)、日语(jpn)、韩语(kor)
  • 混合识别:通过--lang eng+jpn参数可同时处理双语文档

扩展新语言步骤

  1. 安装对应Tesseract语言包(如中文:sudo apt install tesseract-ocr-chi-sim
  2. 编辑config/languages.json添加配置项:
    "chi": {
    "tesseract_code": "chi_sim",
    "google_vision_code": "zh"
    }
  3. 重新启动程序并指定语言参数:
    --lang chi+eng

注意事项:
• 新语言需测试识别精度,复杂布局文档可能需调整YOLO模型参数
• 非拉丁语系语言(如阿拉伯语)需要额外配置文字方向检测
• 推荐优先使用Google Vision API(支持200+语言),但其对公式/表格的识别精度可能降低

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

回顶部

zh_CN简体中文