使用 ShareGPT-4o-Image 数据集需遵循以下步骤:
1. 数据集获取
- 途径一: Acesso Página de rosto de abraço直接下载 Parquet 文件。
- 途径二:通过 Git 克隆 GitHub 仓库:
git clone https://github.com/FreedomIntelligence/ShareGPT-4o-Image.git
.
2. preparação ambiental
- 安装 Python 3.7+ 及依赖库:
pip install pandas datasets
. - 如需运行 Janus-4o 模型,还需安装
torch
responder cantandotransformers
.
3. 加载数据集
Usando a função datasets
库加载:
from datasets import load_dataset
dataset = load_dataset("FreedomIntelligence/ShareGPT-4o-Image")
数据集加载后可直接用于模型训练或分析,具体操作可参考 GitHub 或 Hugging Face 的文档。
Essa resposta foi extraída do artigoShareGPT-4o-Image: um conjunto de dados de geração de imagens multimodais de código abertoO