Posição atual:fig. início " Respostas da IA

A arquitetura híbrida de especialistas permite que o Qwen3-Coder alcance avanços na eficiência do raciocínio

2025-08-20

656

Link diretoVisualização móvel

A arquitetura MoE adotada pelo Qwen3-Coder-480B alcança um equilíbrio entre o tamanho dos parâmetros e a eficiência computacional, e seus 3,5 bilhões de parâmetros de ativação são projetados de modo que o consumo de memória de uma única inferência seja de apenas 15% do modelo denso. Testes de benchmark mostram que sua velocidade de geração de código é 4,2 vezes mais rápida do que a do modelo denso tradicional sob as mesmas condições de hardware, o que é especialmente adequado para cenários de assistência à programação em tempo real. A arquitetura atribui conhecimento de código especializado (por exemplo, programação simultânea, otimização de GPU) a diferentes módulos especializados por meio de um algoritmo de roteamento dinâmico, melhorando a qualidade de geração de código específico de domínio em 37%. Em implantações reais, a versão 7B quantizada em 8 bits pode atingir uma velocidade de geração de 200token/s em GPUs de consumo (por exemplo, RTX 4090), o que atende totalmente aos requisitos de desempenho do plug-in do IDE. Requisitos de desempenho

Essa resposta foi extraída do artigoQwen3-Coder: geração de código-fonte aberto e assistente de programação inteligenteO

A arquitetura híbrida de especialistas permite que o Qwen3-Coder alcance avanços na eficiência do raciocínio

Artigos relacionados

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Ferramentas populares de IA

Novos lançamentos

Ferramentas de IA mais recentes

A arquitetura híbrida de especialistas permite que o Qwen3-Coder alcance avanços na eficiência do raciocínio

Artigos relacionados

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Ferramentas populares de IA

Novos lançamentos

Ferramentas de IA mais recentes

Ferramenta de IA da estação de consulta rápida