当前位置：首页 » AI答疑

什么是 SmolDocling，它有哪些核心功能？

2025-08-28

1.7 K

SmolDocling 是由 ds4sd 团队与 IBM 合作开发的一款视觉语言模型（VLM），基于 SmolVLM-256M 打造。其核心特点是小体积（仅 256M 参数）和高效率，特别适合在普通设备上运行。模型托管在 Hugging Face 平台，是全球最小的视觉语言模型。

主要功能包括：

与其他通用视觉模型不同，SmolDocling 专门针对文档转换任务进行了优化，特别适合学术研究、编程文档处理等需要精确解析复杂排版的应用场景。

快速查询站内AI工具