海外访问：www.kdjingpai.com

Ctrl + D 收藏本站

当前位置：首页 » AI答疑

ShareGPT-4o-Image 数据集的主要内容和特点是什么？

2025-08-20

527

链接直达手机查看

ShareGPT-4o-Image 是一个开源的大型多模态图像生成数据集，由 FreedomIntelligence 团队发布，旨在帮助开源多模态模型对齐 GPT-4o 的图像生成能力。数据集包含 91K 个高质量样本，分为两类：

45K 个文本到图像样本：仅通过文本提示生成图像。
46K 个文本加图像到图像样本：基于输入图像和文本提示进行图像编辑。

该数据集采用 Parquet 格式存储，大小约 20.7 MB，包含 92,256 行数据，可在 Hugging Face 或 GitHub 免费获取。其核心特点是：

支持多模态模型训练，提升图像生成和编辑能力。
为社区提供高质量资源，促进开源多模态 AI 的发展。
配套开发的 Janus-4o 模型性能优于前代 Janus-Pro。

本答案来源于文章《ShareGPT-4o-Image：开源的多模态图像生成数据集》

相关文章

未经允许不得转载：AI生产力工具 » ShareGPT-4o-Image 数据集的主要内容和特点是什么？

相关推荐