SkyworkUniPic是由SkyworkAI开发的开源多模态模型,专注于图像理解、文本生成图像和图像编辑三大核心功能。它采用单一的1.5亿参数架构整合了这些视觉语言任务,使得开发者可以在一个统一的框架下处理多种图像相关任务。该模型在GenEval、DPG-Bench等基准测试中表现优异,证明了其在图像生成和理解方面的能力。
模型采用MIT许可证,代码和模型权重均在GitHub上开放,鼓励开发者自由使用和修改。这种开源策略大大降低了开发者探索视觉AI应用的门槛,同时也为社区贡献提供了便利。
本答案来源于文章《SkyworkUniPic:统一处理图像理解与生成的开源模型》