Os seguintes preparativos precisam ser concluídos antes da implementação da Etapa 3:
- Código para obter:Obtenha o código-fonte do repositório do GitHub (https://github.com/stepfun-ai/Step3.git) com o comando git clone
- Ambiente Python:Recomendado Python 3.10+ com PyTorch (≥2.1.0) e a biblioteca Transformers (versão recomendada 4.54.0) instalados
- Pesos do modelo:Faça o download dos arquivos de pesos no formato bf16 ou block-fp8 da plataforma Hugging Face (https://huggingface.co/stepfun-ai/step3)
- Requisitos de hardware:A prática recomendada é ter 4 GPUs A800/H800 com 80 GB de RAM, mas uma única GPU também pode executar
A configuração do ambiente cria um ambiente isolado via conda e instala a versão especificada da estrutura de aprendizagem profunda. As instruções completas de implantação estão detalhadas na documentação do projeto.
Essa resposta foi extraída do artigoEtapa 3: geração eficiente de macromodelos de código aberto para conteúdo multimodalO