为保证最佳效果,需要注意以下要点:
- Qualität der Eingabe:图片分辨率建议 300dpi 以上,避免强光反光。手写内容需字迹清晰
- Hardware-Konfiguration:处理 A4 尺寸文档至少需要 4GB 内存,超大文件建议先裁剪
- Parametrisierung:复杂文档需增大 max_new_tokens 值,表格密集时可设为 16384
常见问题解决方法:
- 内容缺失:检查是否触达 token 上限,或图片存在畸变
- 格式错乱:更新 docling_core 库到最新版
- GPU 未启用:确认已安装 CUDA 版 PyTorch
对于企业级应用,建议:
- 建立图片预处理流程(自动裁剪/增强)
- 对特定文档类型微调 prompt 模板
- 定期清理模型缓存(默认存储在 ~/.cache/huggingface/)
Diese Antwort stammt aus dem ArtikelSmolDocling: ein visuelles Sprachmodell für die effiziente Verarbeitung von Dokumenten in einem kleinen VolumenDie