ShareGPT-4o-Image ist ein großer Open-Source-Datensatz zur multimodalen Bilderzeugung, der vom FreedomIntelligence-Team veröffentlicht wurde, um Open-Source-Modelle zur multimodalen Bilderzeugung an die Fähigkeiten von GPT-4o anzupassen. Der Datensatz enthält 91K qualitativ hochwertige Beispiele, die in zwei Kategorien unterteilt sind:
- 45K Text-zu-Bild-BeispieleGenerieren Sie Bilder nur aus Textvorgaben.
- 46K Text plus Bild-zu-Bild-BeispieleBildbearbeitung auf der Grundlage von eingegebenen Bildern und Textanweisungen.
Der Datensatz ist im Parquet-Format gespeichert, hat eine Größe von etwa 20,7 MB, enthält 92.256 Datenzeilen und ist auf Hugging Face oder GitHub frei verfügbar. Seine wichtigsten Merkmale sind:
- Unterstützt multimodales Modelltraining zur Verbesserung der Bilderzeugung und -bearbeitung.
- Bereitstellung von qualitativ hochwertigen Ressourcen für die Entwicklung von Open-Source-Multimodal-KI in der Community.
- Das Begleitmodell Janus-4o wurde entwickelt, um sein Vorgängermodell Janus-Pro zu übertreffen.
Diese Antwort stammt aus dem ArtikelShareGPT-4o-Image: ein quelloffener Datensatz zur multimodalen BilderzeugungDie