SkyworkUniPic是由SkyworkAI开发的一个开源多模态模型,专注于图像理解、文本生成图像和图像编辑三大功能。它采用单一的1.5亿参数架构,整合了多种视觉语言任务。具体功能包括:
- 图像理解:分析输入图像内容,回答相关问题或提取信息。
- 文本生成图像:根据文字描述生成1024×1024像素的高质量图像。
- 图像编辑:通过文字指令修改图像,例如替换特定元素或调整风格。
此外,UniPic支持消费级GPU(如RTX 4090)运行,并提供了开源模型权重和MIT许可证,方便开发者自由使用和修改。
本答案来源于文章《SkyworkUniPic:统一处理图像理解与生成的开源模型》































