Posição atual:fig. início » Tutoriais práticos de IA

Comparação dos recursos de código dos codificadores GLM-4.5, Kimi K2 e Qwen3

2025-08-01

2.6 K

Recentemente, a Smart Spectrum AI anunciou seu GLM-4.5 Uma série de modelos se junta às fileiras de código aberto, revigorando a comunidade de código aberto para grandes modelos de linguagem. O código-fonte aberto consiste principalmente em dois modelos baseados na arquitetura Mixed Expert (MoE), que permite que os modelos dimensionem com eficiência o tamanho total de seus parâmetros e mantenham o custo computacional baixo, ativando apenas uma parte dos especialistas (ou seja, uma parte da rede neural) durante o processo de inferência.

Os dois modelos lançados são:

GLM-4.5-355BO número total de participantes é de 355 bilhões e o número de participantes ativados é de 32 bilhões.
GLM-4.5-AirO número total de participantes é de 106 bilhões e o número de participantes ativados é de 12 bilhões.

Em uma escala paramétrica.GLM-4.5 O design da empresa mostra uma busca por eficiência. Por exemplo, sua contagem total de 355 bilhões de participantes é de aproximadamente DeepSeek-R1 metade de e Kimi-K2 de um terço.

Avaliação comparativa de desempenho e estratégia de preços

Em termos de avaliação de desempenho.GLM-4.5 Incluindo MMLU Pro、AIME24、MATH 500 和 SWE-Bench Verified Ele tem um bom desempenho em 12 benchmarks públicos, incluindo o As pontuações médias combinadas mostram queGLM-4.5 Ele está classificado em terceiro lugar entre os modelos globais, bem como em primeiro lugar nas categorias de modelos domésticos e de código aberto. Em particular, a capacidade de correção de código medida na categoria SWE-Bench O excelente desempenho em tais benchmarks confiáveis é um bom presságio para sua possível aplicação no desenvolvimento de software.

Em termos de preços de chamadas de API, oGLM-4.5 É usado um modelo de preço escalonado. Quando o número de tokens de entrada está no intervalo de 0-32k e o número de tokens de saída está no intervalo de 0-0,2k, o preço é de US$ 0,8/milhão de tokens para entrada e US$ 2/milhão de tokens para saída. Deepseek R1 和 Kimi k2 e outros modelos a serem examinados.

Além disso, a versão de alta velocidade do modelo demonstra uma velocidade de geração de até 100 tokens/segundo em testes reais, o que é uma vantagem importante para cenários de aplicativos que exigem interação em tempo real.

Teste real de capacidade de código multidimensional

Para verificar GLM-4.5 e a estética do design em aplicativos do mundo real, nós o comparamos a dois outros modelos renomados do setor, o Dark Side of the Moon desenvolvido pela Kimi K2 e a AliCloud lançou o Qwen3 Coder-conduziu uma série de revisões lado a lado.

Teste 1: geração de página de login modernizada

A primeira é uma tarefa básica de desenvolvimento de front-end com o objetivo de avaliar a capacidade do modelo de gerar componentes regulares da Web.

Palavras-chave do teste:

Crie uma página de login modernizada que contenha os seguintes recursos:

Caixa de entrada de caixa postal e senha
botão de login
"Opções "Lembrar-me" e "Esqueci minha senha
Login de terceiros do Google
Link de registro

Requisitos: tema escuro, estilo tecnológico futurista, layout centralizado, boa experiência do usuário.

Todos os três modelos geraram com sucesso páginas de login totalmente funcionais com efeitos básicos de interação. Cada um deles tem seu próprio foco em termos de estilo de design, oQwen3 Coder O esquema de cores é mais proeminente, e o GLM-4.5 和 Kimi K2 Também são fornecidas realizações de alta qualidade.

Teste 2: Cartões animados sobre o clima

O segundo teste aumentou a complexidade da interação entre a animação CSS e o JavaScript, com a tarefa de criar um cartão meteorológico animado que exibe dinamicamente várias condições meteorológicas.

Palavras-chave do teste:

Create a single HTML file containing CSS and JavaScript to generate an animated weather card. The card should visually represent the following weather conditions with distinct animations:
Wind: (e.g., moving clouds, swaying trees, or wind lines)
Rain: (e.g., falling raindrops, puddles forming)
Sun: (e.g., shining rays, bright background)
Snow: (e.g., falling snowflakes, snow accumulating)
Show all the weather card side by side.
The card should have a dark background.
Provide all the HTML, CSS, and JavaScript code within this single file. The JavaScript should include a way to switch between the different weather conditions.

Nesse teste, oGLM-4.5 O desempenho do cartão é muito melhor. Os cartões gerados não são apenas animados com suavidade, mas também mais refinados nos detalhes da interface do usuário (UI), e o design geral é mais agradável esteticamente.

Teste 3: Cartões de conhecimento de estilo de revista de alta moda

Para avaliar ainda mais a capacidade do modelo em um alto nível de design e estética, foi introduzido um prompt mais especializado, exigindo que o modelo assumisse o papel de um importante diretor de arte de uma revista digital internacional, projetando um cartão de conhecimento futurista inspirado em tecnologia.

Palavras-chave do teste:

Você é um dos principais diretores de arte de revistas digitais internacionais e especialista em desenvolvimento front-end que projetou layouts digitais para revistas de moda, como Vogue e Elle, e é especializado em combinar a estética de revistas de luxo com o design moderno da Web para criar experiências visuais impressionantes.

mandatos

Use a Futuristic Tech para criar cartões de conhecimento no estilo de revista de alta moda, apresentando informações diárias em um layout de revista sofisticado e luxuoso, proporcionando aos usuários o prazer visual de folhear uma revista de alta qualidade.

Área de data: apresenta a data atual de uma maneira exclusiva para cada estilo
Títulos e subtítulos: ajuste as fontes, os tamanhos e a tipografia de acordo com o estilo
Bloco de citação: crie um estilo de citação exclusivo, refletindo as características do estilo
Lista de marcadores principais: apresentação do conteúdo da lista de maneira adequada ao estilo
Nota/dica do editor: crie-o para se adequar ao estilo da barra lateral ou da anotação

Especificações técnicas:

* 使用HTML5、Font Awesome、Tailwind CSS和必要的JavaScript
* FontAwesome: [https://lf6-cdn-tos.bytecdntp.com/cdn/expire-100-M/font-awesome/6.0.0/css/all.min.css](https://lf6-cdn-tos.bytecdntp.com/cdn/expire-100-M/font-awesome/6.0.0/css/all.min.css)
* Tailwind CSS: <https://lf3-cdn-tos.bytecdntp.com/cdn/expire-1-M/tailwindcss/2.2.19/tailwind.min.css>
* 中文字体: [https://fonts.geekzu.org/css2?family=Noto+Serif+SC:wght@400;500;600;700&family=Noto+Sans+SC:wght@300;400;500;700&display=swap](https://fonts.geekzu.org/css2?family=Noto+Serif+SC:wght@400;500;600;700&family=Noto+Sans+SC:wght@300;400;500;700&display=swap)

Considere adicionar efeitos dinâmicos sutis, como um efeito de fade-in quando a página for carregada ou um feedback sutil ao passar o mouse.
Garantir que o código seja limpo e eficiente, com foco no desempenho e na capacidade de manutenção
Use variáveis CSS para gerenciar cores e espaçamento para obter consistência de estilo
Para o estilo de morfismo digital líquido, devem ser adicionados efeitos dinâmicos fluidos e transições de gradiente
Para um estilo minimalista ultrassensorial, cada pixel e feedback interativo sutil devem ser controlados com precisão
Para o estilo de visualização de dados neoexpressionista, é importante incorporar os dados visualmente ao design

Requisitos de saída:

O código deve ser elegante e estar em conformidade com as práticas recomendadas, e o CSS deve refletir a máxima atenção aos detalhes
Projetado para uma largura de 440px e uma altura não superior a 1280px
Abstrair e refinar o assunto, mostrando apenas os pontos de coluna ou as citações de frases mais centrais, tornando a leitura gratificante
Sempre com a saída em chinês, os elementos decorativos podem ser usados em outros idiomas, como francês e inglês, para dar uma aparência impressionante.

Com a visão e os padrões estéticos de um dos principais diretores de arte de revistas internacionais, crie cartões no estilo de revistas digitais que sejam diferentes em estilo, mas igualmente impressionantes, para que os usuários possam sentir que "este não é apenas um cartão de informações comum, mas uma peça de arte digital colecionável".

Kimi K2 与 Qwen3 Coder Os resultados da geração são os seguintes:

Nessa comparação, oGLM-4.5 As vantagens se tornam ainda mais óbvias. O cartão que ele gera não só destaca efetivamente a sensação futurista por meio do fundo brilhante com um esquema de cores harmonioso, mas, o que é mais importante, é o único modelo que incorpora elementos interativos em seu design. Quando o mouse passa, o cartão tem o feedback correspondente, aprimorando a experiência do usuário.

Teste 4: Jogo 3D Bricks

O teste final é uma tarefa complexa que exige que o modelo seja testado usando o Three.js Crie um jogo 3D de quebra de tijolos totalmente controlado pelo mouse que examine a capacidade do modelo de lidar com uma combinação de lógica de jogo, mecanismo de física e efeitos visuais.

Palavras-chave do teste:

"Crie um jogo de quebra de tijolos em 3D controlado inteiramente pelo mouse:

Use o Three.js para criar uma cena 3D imersiva com os seguintes componentes principais: uma raquete de jogador deslizante da esquerda para a direita: controlada pelo movimento horizontal do mouse; uma esfera saltitante com propriedades físicas: velocidade inicial moderada, seguindo a lei da reflexão após a colisão; e fileiras de tijolos coloridos que pairam: cores diferentes correspondem a pontuações diferentes.
Requisitos de efeito físico: detecção de colisão: colisão precisa da esfera com tijolos/barreiras/limites; rebote dinâmico: a colisão em diferentes posições da barreira altera o ângulo de rebote horizontal da bola; simulação de gravidade: a trajetória da esfera tem a forma de uma parábola natural.
Mecânica do jogo: Sistema de pontuação: pontuação em tempo real para quebrar tijolos (tijolos normais = 10 pontos, tijolos dourados = 50 pontos); Valor de vida: 3 vidas iniciais, a vida será deduzida se a bola cair no fundo; Evolução da velocidade: para cada 10 tijolos quebrados, a velocidade da bola será aumentada em 15%
Efeitos visuais: efeito de explosão de partículas acionado quando os tijolos são esmagados; efeito de luz de arrasto dinâmico adicionado à trajetória da esfera; animação de onda de choque em forma de anel aparece quando o defletor colide.
Aprimoramentos de interação: exibição em tempo real da pontuação e do valor de vida no HUD; tela de fim de jogo mostrando a pontuação final + botão de reinício; adição de efeitos sonoros de colisão (usando a API de áudio da Web)"

Em termos de realização finalGLM-4.5 Os jogos gerados eram os mais jogáveis, tinham a maior integridade da lógica do jogo e geravam o menor número de bugs, comprovando mais uma vez sua capacidade de liderança para lidar com tarefas complexas de geração de código.

Em conjunto.GLM-4.5 Ele demonstrou uma forte combinação de pontos fortes na geração de código, especialmente para tarefas que combinam estética de design e interações complexas. Sua taxa de sucesso única na geração de código e sua capacidade de controlar detalhes fazem dele um modelo de código aberto de alto desempenho digno da atenção dos desenvolvedores.

Não pode ser reproduzido sem permissão:Ferramentas de produtividade de IA » Comparação dos recursos de código dos codificadores GLM-4.5, Kimi K2 e Qwen3

Comparação dos recursos de código dos codificadores GLM-4.5, Kimi K2 e Qwen3

Avaliação comparativa de desempenho e estratégia de preços

Teste real de capacidade de código multidimensional

Teste 1: geração de página de login modernizada

Teste 2: Cartões animados sobre o clima

Teste 3: Cartões de conhecimento de estilo de revista de alta moda

mandatos

Teste 4: Jogo 3D Bricks

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Ferramentas populares de IA

Novos lançamentos

Ferramentas de IA mais recentes

Comparação dos recursos de código dos codificadores GLM-4.5, Kimi K2 e Qwen3

Avaliação comparativa de desempenho e estratégia de preços

Teste real de capacidade de código multidimensional

Teste 1: geração de página de login modernizada

Teste 2: Cartões animados sobre o clima

Teste 3: Cartões de conhecimento de estilo de revista de alta moda

mandatos

Teste 4: Jogo 3D Bricks

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Ferramentas populares de IA

Novos lançamentos

Ferramentas de IA mais recentes

Ferramenta de IA da estação de consulta rápida