该系统的创新性在于引入了提示词(prompt)控制机制,用户只需修改输入指令即可切换处理模式。例如使用prompt_layout_only_en指令时仅执行英文文档的版面分析,而prompt_ocr模式专注于文字提取并自动过滤装饰性内容。这种设计相比传统需要重新加载模型的方法,能将任务切换时间缩短80%以上。系统预置了7种专业提示模版,涵盖从全功能解析到特定元素提取等各种场景需求。
Essa resposta foi extraída do artigodots.ocr: um modelo visual-linguístico unificado para análise de layout de documentos multilínguesO