ShareGPT-4o-Image 是一个开源的大型多模态图像生成数据集,由 FreedomIntelligence 团队发布,旨在帮助开源多模态模型对齐 GPT-4o 的图像生成能力。数据集包含 91K 个高质量样本,分为两类:
- 45K 个文本到图像样本:仅通过文本提示生成图像。
- 46K 个文本加图像到图像样本:基于输入图像和文本提示进行图像编辑。
该数据集采用 Parquet 格式存储,大小约 20.7 MB,包含 92,256 行数据,可在 Hugging Face 或 GitHub 免费获取。其核心特点是:
- 支持多模态模型训练,提升图像生成和编辑能力。
- 为社区提供高质量资源,促进开源多模态 AI 的发展。
- 配套开发的 Janus-4o 模型性能优于前代 Janus-Pro。
本答案来源于文章《ShareGPT-4o-Image:开源的多模态图像生成数据集》