As etapas a seguir precisam ser seguidas para usar o conjunto de dados ShareGPT-4o-Image:
1. acesso a conjuntos de dados
- rota 1: Acesso Página de rosto de abraçoFaça o download do arquivo Parquet diretamente.
- rota 2Clonar um repositório do GitHub via Git:
git clone https://github.com/FreedomIntelligence/ShareGPT-4o-Image.git.
2. preparação ambiental
- Instale o Python 3.7+ e as bibliotecas dependentes:
pip install pandas datasets. - Para executar o modelo Janus-4o, você também precisa instalar o pacote
torchresponder cantandotransformers.
3. carregamento de conjuntos de dados
Usando a função datasets Carregamento da biblioteca:
from datasets import load_dataset
dataset = load_dataset("FreedomIntelligence/ShareGPT-4o-Image")
Uma vez carregado, o conjunto de dados pode ser usado diretamente para treinamento ou análise do modelo, conforme documentado no GitHub ou no Hugging Face.
Essa resposta foi extraída do artigoShareGPT-4o-Image: um conjunto de dados de geração de imagens multimodais de código abertoO

































