OmniSVG 是一个基于多模态模型的开源项目,专注于生成高质量可编辑的矢量图形(SVG格式)。该项目由复旦大学和 StepFun 团队联合开发,其核心特点是利用预训练的视觉-语言模型实现两种主要生成方式:
- 文本生成SVG:通过自然语言描述(如“红色五角星”)直接输出矢量图形
- Image to SVG:将光栅图像(如PNG/JPG)转换为可缩放的矢量路径
当前版本的核心功能还包括:
- 角色一致性生成:基于参考图保持动漫角色风格统一
- 复杂图形支持:可输出高细节插图和角色设计
- 数据集与评估协议:提供MMSVG数据集(含图标/插图子集)和MMSVG-Bench质量标准
项目现阶段聚焦研究用途,未来将开源完整模型代码,支持用户自定义训练和优化。
This answer comes from the articleOmniSVG: from text and images to generate SVG vector graphics open source projectThe