O ShareGPT-4o-Image é um grande conjunto de dados de geração de imagens multimodais de código aberto lançado pela equipe da FreedomIntelligence para ajudar os modelos multimodais de código aberto a alinhar os recursos de geração de imagens do GPT-4o. O conjunto de dados contém 91 mil amostras de alta qualidade divididas em duas categorias:
- 45 mil amostras de texto para imagemGerar imagens somente a partir de prompts de texto.
- 46K de texto e amostras de imagem para imagemEdição de imagens com base em imagens de entrada e avisos de texto.
O conjunto de dados é armazenado no formato Parquet, tem cerca de 20,7 MB, contém 92.256 linhas de dados e está disponível gratuitamente no Hugging Face ou no GitHub. Seus principais recursos são:
- Oferece suporte ao treinamento de modelos multimodais para aprimorar a geração e a edição de imagens.
- Fornecer à comunidade recursos de alta qualidade para o desenvolvimento de IA multimodal de código aberto.
- O modelo Janus-4o foi desenvolvido para superar o desempenho de seu antecessor, o Janus-Pro.
Essa resposta foi extraída do artigoShareGPT-4o-Image: um conjunto de dados de geração de imagens multimodais de código abertoO