使用 ShareGPT-4o-Image 数据集需遵循以下步骤:
1. 数据集获取
- 途径一アクセス ハグする顔 ページ直接下载 Parquet 文件。
- 途径二:通过 Git 克隆 GitHub 仓库:
git clone https://github.com/FreedomIntelligence/ShareGPT-4o-Image.git
.
2.環境準備
- 安装 Python 3.7+ 及依赖库:
pip install pandas datasets
. - 如需运行 Janus-4o 模型,还需安装
torch
歌で応えるtransformers
.
3. 加载数据集
Pythonの datasets
库加载:
from datasets import load_dataset
dataset = load_dataset("FreedomIntelligence/ShareGPT-4o-Image")
数据集加载后可直接用于模型训练或分析,具体操作可参考 GitHub 或 Hugging Face 的文档。
この答えは記事から得たものである。ShareGPT-4o-Image:オープンソースのマルチモーダル画像生成データセットについて