Janus-4o 是基于 ShareGPT-4o-Image 数据集微调的多模态模型,主要功能包括:
- Text-to-Image Generation:根据文本提示(如“夕阳下的海滩”)生成高质量图像。
- image editing:通过文本和输入图像(如“将天空替换为星空”)修改图像内容。
与 GPT-4o 相比,Janus-4o 作为开源模型,性能略逊于 GPT-4o,但其优势在于:
- Completely open source:允许开发者自由使用和修改。
- lightweighting:适合本地化部署,支持社区定制化开发。
- 配套数据集:提供 91K 样本用于进一步优化模型。
需注意,Janus-4o 需要 GPU(推荐 16GB 显存)以获得最佳性能,CPU 模式速度较慢。
This answer comes from the articleShareGPT-4o-Image: an open source multimodal image generation datasetThe