针对医疗文本的特殊性,建议采用以下组合方案:
- Auswahl des Modells:强制指定
model=mineru
参数,该模型内置医学术语库(含ICD-10编码) - Verbesserung der Vorverarbeitung:对模糊的手写处方,先用PP-StructureV3进行图像增强,再提交识别
- 术语修正:在API请求中添加
specialty=medical
头部字段,激活领域自适应算法 - Zweifacher Prüfsummen-Mechanismus:同时运行MonkeyOCR快速版获取初结果,用Dolphin模型二次校验关键字段
- 结果格式化:选择Markdown输出格式,系统会自动标注药品剂量、诊断结果等关键字段
Diese Antwort stammt aus dem ArtikelAI Fast Station: ein Tool zum Parsen von Dokumenten für den Vergleich von OCR-Modellen mit einem KlickDie