Os pesos do modelo da Step3 são armazenados nos formatos bf16 e block-fp8, que otimizam a eficiência do armazenamento e da computação dos pesos do modelo. Os desenvolvedores podem baixar esses pesos da plataforma Hugging Face e selecionar o formato apropriado de acordo com suas necessidades. Essa otimização reduz os requisitos de hardware e é particularmente adequada para a implantação em ambientes com várias GPUs, como o uso de quatro GPUs A800/H800 com 80 GB de memória gráfica para obter o desempenho ideal.
Essa resposta foi extraída do artigoEtapa 3: geração eficiente de macromodelos de código aberto para conteúdo multimodalO