O Step3 é um macromodelo multimodal de código aberto desenvolvido pela StepFun, cujos principais recursos técnicos incluem:
- Usando a arquitetura Mixed Model of Expertise (MoE) com 32,1 bilhões de parâmetros totais (3,8 bilhões de parâmetros ativos), otimizando significativamente a velocidade e o desempenho da inferência
- Recursos de geração de conteúdo multimodal com suporte a texto, imagens e fala
- Os pesos do modelo são armazenados nos formatos bf16 e block-fp8, reduzindo os requisitos de hardware.
- Interface de API padronizada compatível com OpenAI e Anthropic
O projeto é licenciado sob a licença de código aberto Apache 2.0, que permite aos desenvolvedores usar, modificar e distribuir livremente o código e os pesos do modelo. Essa licença oferece aos desenvolvedores a flexibilidade de usar o código para fins comerciais e de pesquisa, refletindo totalmente a filosofia da StepFun de promover o desenvolvimento da IA por meio de código aberto.
Essa resposta foi extraída do artigoEtapa 3: geração eficiente de macromodelos de código aberto para conteúdo multimodalO