Janus-4o 是基于 ShareGPT-4o-Image 数据集微调的多模态模型,主要功能包括:
- 文本到图像生成:根据文本提示(如“夕阳下的海滩”)生成高质量图像。
- 图像编辑:通过文本和输入图像(如“将天空替换为星空”)修改图像内容。
与 GPT-4o 相比,Janus-4o 作为开源模型,性能略逊于 GPT-4o,但其优势在于:
- 完全开源:允许开发者自由使用和修改。
- 轻量化:适合本地化部署,支持社区定制化开发。
- 配套数据集:提供 91K 样本用于进一步优化模型。
需注意,Janus-4o 需要 GPU(推荐 16GB 显存)以获得最佳性能,CPU 模式速度较慢。
本答案来源于文章《ShareGPT-4o-Image:开源的多模态图像生成数据集》