Os principais recursos do Qwen3-Coder se refletem em três aspectos: em primeiro lugar, ele é um modelo de especialista misto (MoE) com 48 bilhões de parâmetros e 3,5 bilhões de parâmetros ativados, o que é uma escala superior no campo de geração de código. Em segundo lugar, ele suporta um longo recurso de processamento de contexto de 256 mil tokens nativamente e até 1 milhão de tokens por meio da tecnologia de extensão YaRN, que é uma das principais janelas de contexto nos modelos de código aberto atuais. O terceiro é seu recurso multimodal, que não apenas lida com linguagens de programação textuais, mas também integra ferramentas complexas, como operações de navegador por meio de tarefas de agente.
Em termos de recursos técnicos, o modelo usa um mecanismo de ativação inovador para ativar apenas 3,5 bilhões de parâmetros por meio de uma técnica de roteamento dinâmico e, ao mesmo tempo, manter grandes recursos de modelo, o que reduz drasticamente o consumo de recursos computacionais. Em termos de capacidade de reparo de código, suas pontuações de benchmark Aider são comparáveis às do GPT-4o, e ele é particularmente bom em lidar com erros de código complexos na interseção de várias linguagens.
Os pontos fortes da arquitetura do modelo o tornam particularmente adequado para: 1) análise de base de código em nível empresarial; 2) desenvolvimento de projetos em várias linguagens; e 3) criação de fluxo de trabalho automatizado. Esses recursos fazem com que ele se destaque no campo da modelagem de código aberto.
Essa resposta foi extraída do artigoQwen3-Coder: geração de código-fonte aberto e assistente de programação inteligenteO

































