FreedomIntelligenceチームによって導入されたShareGPT-4o-Imageは、現在オープンソースコミュニティで利用可能な最大かつ最高品質のマルチモーダル画像生成ベンチマークデータセットの1つです。このデータセットには、厳密にスクリーニングされた91,000のサンプルが含まれており、そのうち45,000はテキストから画像への生成に焦点を当て、46,000はテキストと画像から画像への編集タスクをサポートしています。GPT-4oの強力な画像生成機能をベースに構築されたこのデータセットは、意味理解、ディテールの削減、クリエイティブなパフォーマンスにおいて、業界をリードするレベルに達しています。
このデータセットはParquet形式で保存され、わずか20.7MBの容量に92,256行の高品質データを含み、極めて高いデータ密度を示しています。従来のオープンソースデータセットとは異なり、ShareGPT-4o-Imageは、GPT-4oの高度な画像生成機能を調整するために特別に設計されており、マルチモーダルタスクにおけるオープンソースモデルのパフォーマンスを大幅に向上させることができます。このデータセットは、Hugging Faceプラットフォーム上で無料でダウンロードできるため、研究者にモデルのトレーニングに直接使用できる標準ベンチマークを提供します。
この答えは記事から得たものである。ShareGPT-4o-Image:オープンソースのマルチモーダル画像生成データセットについて

































