A equipe da FreedomIntelligence adotou uma estratégia de código-fonte totalmente aberto para lançar o conjunto de dados ShareGPT-4o-Image e o modelo Janus-4o, reduzindo significativamente o limite de pesquisa para IA multimodal. O projeto está aberto simultaneamente nas plataformas GitHub e Hugging Face, e inclui documentação completa, exemplos de uso e diretrizes de contribuição. Esse modelo aberto permite que pesquisadores de todo o mundo trabalhem juntos para melhorar a qualidade do conjunto de dados, otimizar o desempenho do modelo e formar um ecossistema saudável de colaboração comunitária.
A equipe adotou o protocolo de código aberto Apache-2.0 para garantir o acesso gratuito a esses recursos para usuários comerciais e acadêmicos. O projeto formou uma cadeia completa de ferramentas, incluindo coleta de dados, treinamento de modelos e implantação de aplicativos, e os membros da comunidade podem enviar Pull Requests para complementar novas amostras, otimizar arquiteturas de modelos ou desenvolver casos de uso. Esse modelo colaborativo está acelerando a democratização das tecnologias multimodais, permitindo que mais desenvolvedores participem de pesquisa e desenvolvimento de IA de ponta.
Essa resposta foi extraída do artigoShareGPT-4o-Image: um conjunto de dados de geração de imagens multimodais de código abertoO