Posição atual:fig. início " Respostas da IA

Quais são os principais componentes e recursos do conjunto de dados ShareGPT-4o-Image?

2025-08-20

528

Link diretoVisualização móvel

O ShareGPT-4o-Image é um grande conjunto de dados de geração de imagens multimodais de código aberto lançado pela equipe da FreedomIntelligence para ajudar os modelos multimodais de código aberto a alinhar os recursos de geração de imagens do GPT-4o. O conjunto de dados contém 91 mil amostras de alta qualidade divididas em duas categorias:

45 mil amostras de texto para imagemGerar imagens somente a partir de prompts de texto.
46K de texto e amostras de imagem para imagemEdição de imagens com base em imagens de entrada e avisos de texto.

O conjunto de dados é armazenado no formato Parquet, tem cerca de 20,7 MB, contém 92.256 linhas de dados e está disponível gratuitamente no Hugging Face ou no GitHub. Seus principais recursos são:

Oferece suporte ao treinamento de modelos multimodais para aprimorar a geração e a edição de imagens.
Fornecer à comunidade recursos de alta qualidade para o desenvolvimento de IA multimodal de código aberto.
O modelo Janus-4o foi desenvolvido para superar o desempenho de seu antecessor, o Janus-Pro.

Essa resposta foi extraída do artigoShareGPT-4o-Image: um conjunto de dados de geração de imagens multimodais de código abertoO

Quais são os principais componentes e recursos do conjunto de dados ShareGPT-4o-Image?

Artigos relacionados

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Ferramentas populares de IA

Novos lançamentos

Ferramentas de IA mais recentes

Quais são os principais componentes e recursos do conjunto de dados ShareGPT-4o-Image?

Artigos relacionados

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Ferramentas populares de IA

Novos lançamentos

Ferramentas de IA mais recentes

Ferramenta de IA da estação de consulta rápida