该模型的训练数据包含超过200万份多语言文档样本,特别强化了对藏语、斯瓦希里语等39种低资源语种的支持。通过跨语言迁移学习和对抗训练技术,在不依赖额外标注数据的情况下,其小语种识别准确率比主流OCR系统平均提升47%。测试表明,即使用户仅提供英语提示词,系统也能正确识别非拉丁语系文字的排版结构和内容,这对处理跨境商务文件和多语种档案具有重要价值。
Essa resposta foi extraída do artigodots.ocr: um modelo visual-linguístico unificado para análise de layout de documentos multilínguesO