ShareGPT-4o-Imageは、オープンソースのマルチモーダルモデルがGPT-4oの画像生成機能を揃えるのを助けるために、FreedomIntelligenceチームによって公開されたオープンソースの大規模なマルチモーダル画像生成データセットです。このデータセットには、2つのカテゴリに分けられた91Kの高品質サンプルが含まれています:
- 45Kテキストから画像へのサンプルテキストプロンプトのみから画像を生成します。
- 46Kのテキストと画像対画像のサンプル入力画像とテキストプロンプトに基づく画像編集。
データセットはParquetフォーマットで保存され、サイズは約20.7MB、92,256行のデータを含み、Hugging FaceまたはGitHubで自由に利用できる。主な機能は以下の通り:
- 画像生成と編集を強化するマルチモーダルモデルトレーニングをサポート。
- オープンソースのマルチモーダルAI開発のための高品質なリソースをコミュニティに提供する。
- 付属モデルのJanus-4oは、前モデルのJanus-Proを上回る性能を目指して開発された。
この答えは記事から得たものである。ShareGPT-4o-Image:オープンソースのマルチモーダル画像生成データセットについて

































