针对医疗文本的特殊性,建议采用以下组合方案:
- 模型选择:强制指定
model=mineru
参数,该模型内置医学术语库(含ICD-10编码) - 预处理增强:对模糊的手写处方,先用PP-StructureV3进行图像增强,再提交识别
- 术语修正:在API请求中添加
specialty=medical
头部字段,激活领域自适应算法 - 双校验机制:同时运行MonkeyOCR快速版获取初结果,用Dolphin模型二次校验关键字段
- 结果格式化:选择Markdown输出格式,系统会自动标注药品剂量、诊断结果等关键字段
本答案来源于文章《AI快站:一键对比OCR模型的文档解析工具》