O ShareGPT-4o-Image, apresentado pela equipe da FreedomIntelligence, é um dos maiores conjuntos de dados de referência de geração de imagens multimodais e da mais alta qualidade atualmente disponíveis na comunidade de código aberto. O conjunto de dados contém 91.000 amostras rigorosamente selecionadas, das quais 45.000 se concentram na geração de texto para imagem e 46.000 suportam texto e tarefas de edição de imagem para imagem. Desenvolvido com base nos avançados recursos de geração de imagens do GPT-4o, o conjunto de dados atinge níveis líderes do setor em compreensão semântica, redução de detalhes e desempenho criativo.
O conjunto de dados é armazenado no formato Parquet e contém 92.256 linhas de dados de alta qualidade em um volume de apenas 20,7 MB, demonstrando uma densidade de dados extremamente alta. Diferentemente dos conjuntos de dados de código aberto tradicionais, o ShareGPT-4o-Image foi projetado especificamente para alinhar os recursos avançados de geração de imagens do GPT-4o, o que pode melhorar significativamente o desempenho dos modelos de código aberto em tarefas multimodais. O conjunto de dados é gratuito e está aberto para download na plataforma Hugging Face, oferecendo aos pesquisadores uma referência padrão que pode ser usada diretamente para o treinamento de modelos.
Essa resposta foi extraída do artigoShareGPT-4o-Image: um conjunto de dados de geração de imagens multimodais de código abertoO

































