SmolDocling通过三重轻量化设计实现平民化应用:模型层面采用知识蒸馏技术压缩参数规模;运行时内存占用控制在2GB以内;依赖库仅需PyTorch和Transformers两个基础框架。这使得它能在树莓派级别的设备上流畅运行,实测在4核CPU/8GB内存的笔记本上处理速度仍能达到7页/分钟。
部署方案上提供Docker容器化封装和REST API接口两种形态,支持快速集成到现有系统。教育机构案例显示,只需2小时就能在校园服务器集群完成50个计算节点的分布式部署。这种低门槛特性使该技术能快速渗透到中小企业、教育机构和政府部门的文档数字化工作流中。
Essa resposta foi extraída do artigoSmolDocling: um modelo de linguagem visual para o processamento eficiente de documentos em um pequeno volumeO