为保证最佳效果,需要注意以下要点:
- Qualidade de entrada:图片分辨率建议 300dpi 以上,避免强光反光。手写内容需字迹清晰
- Configuração de hardware:处理 A4 尺寸文档至少需要 4GB 内存,超大文件建议先裁剪
- parametrização:复杂文档需增大 max_new_tokens 值,表格密集时可设为 16384
常见问题解决方法:
- 内容缺失:检查是否触达 token 上限,或图片存在畸变
- 格式错乱:更新 docling_core 库到最新版
- GPU 未启用:确认已安装 CUDA 版 PyTorch
对于企业级应用,建议:
- 建立图片预处理流程(自动裁剪/增强)
- 对特定文档类型微调 prompt 模板
- 定期清理模型缓存(默认存储在 ~/.cache/huggingface/)
Essa resposta foi extraída do artigoSmolDocling: um modelo de linguagem visual para o processamento eficiente de documentos em um pequeno volumeO