Recentemente, a Smart Spectrum AI anunciou seu GLM-4.5
Uma série de modelos se junta às fileiras de código aberto, revigorando a comunidade de código aberto para grandes modelos de linguagem. O código-fonte aberto consiste principalmente em dois modelos baseados na arquitetura Mixed Expert (MoE), que permite que os modelos dimensionem com eficiência o tamanho total de seus parâmetros e mantenham o custo computacional baixo, ativando apenas uma parte dos especialistas (ou seja, uma parte da rede neural) durante o processo de inferência.
Os dois modelos lançados são:
- GLM-4.5-355BO número total de participantes é de 355 bilhões e o número de participantes ativados é de 32 bilhões.
- GLM-4.5-AirO número total de participantes é de 106 bilhões e o número de participantes ativados é de 12 bilhões.
Em uma escala paramétrica.GLM-4.5
O design da empresa mostra uma busca por eficiência. Por exemplo, sua contagem total de 355 bilhões de participantes é de aproximadamente DeepSeek-R1
metade de e Kimi-K2
de um terço.
Avaliação comparativa de desempenho e estratégia de preços
Em termos de avaliação de desempenho.GLM-4.5
Incluindo MMLU Pro
eAIME24
eMATH 500
responder cantando SWE-Bench Verified
Ele tem um bom desempenho em 12 benchmarks públicos, incluindo o As pontuações médias combinadas mostram queGLM-4.5
Ele está classificado em terceiro lugar entre os modelos globais, bem como em primeiro lugar nas categorias de modelos domésticos e de código aberto. Em particular, a capacidade de correção de código medida na categoria SWE-Bench
O excelente desempenho em tais benchmarks confiáveis é um bom presságio para sua possível aplicação no desenvolvimento de software.
Em termos de preços de chamadas de API, oGLM-4.5
É usado um modelo de preço escalonado. Quando o número de tokens de entrada está no intervalo de 0-32k e o número de tokens de saída está no intervalo de 0-0,2k, o preço é de US$ 0,8/milhão de tokens para entrada e US$ 2/milhão de tokens para saída. Deepseek R1
responder cantando Kimi k2
e outros modelos a serem examinados.
Além disso, a versão de alta velocidade do modelo demonstra uma velocidade de geração de até 100 tokens/segundo em testes reais, o que é uma vantagem importante para cenários de aplicativos que exigem interação em tempo real.
Teste real de capacidade de código multidimensional
Para verificar GLM-4.5
e a estética do design em aplicativos do mundo real, nós o comparamos a dois outros modelos renomados do setor, o Dark Side of the Moon desenvolvido pela Kimi K2
e a AliCloud lançou o Qwen3 Coder
-conduziu uma série de revisões lado a lado.
Teste 1: geração de página de login modernizada
A primeira é uma tarefa básica de desenvolvimento de front-end com o objetivo de avaliar a capacidade do modelo de gerar componentes regulares da Web.
Palavras-chave do teste:
Crie uma página de login modernizada que contenha os seguintes recursos:
- Caixa de entrada de caixa postal e senha
- botão de login
- "Opções "Lembrar-me" e "Esqueci minha senha
- Login de terceiros do Google
- Link de registro
Requisitos: tema escuro, estilo tecnológico futurista, layout centralizado, boa experiência do usuário.
Todos os três modelos geraram com sucesso páginas de login totalmente funcionais com efeitos básicos de interação. Cada um deles tem seu próprio foco em termos de estilo de design, oQwen3 Coder
O esquema de cores é mais proeminente, e o GLM-4.5
responder cantando Kimi K2
Também são fornecidas realizações de alta qualidade.
Teste 2: Cartões animados sobre o clima
O segundo teste aumentou a complexidade da interação entre a animação CSS e o JavaScript, com a tarefa de criar um cartão meteorológico animado que exibe dinamicamente várias condições meteorológicas.
Palavras-chave do teste:
Crie um único arquivo HTML contendo CSS e JavaScript para gerar um cartão meteorológico animado. O cartão deve representar visualmente as seguintes condições meteorológicas com animações distintas. O cartão deve representar visualmente as seguintes condições meteorológicas com animações distintas.
Vento: (por exemplo, nuvens em movimento, árvores balançando ou linhas de vento)
Chuva: (por exemplo, gotas de chuva caindo, formação de poças)
Sol: (por exemplo, raios brilhantes, fundo claro)
Neve: (por exemplo, flocos de neve caindo, neve acumulada)
Mostre todos os cartões meteorológicos lado a lado.
O cartão deve ter um fundo escuro.
Forneça todo o código HTML, CSS e JavaScript nesse único arquivo. O JavaScript deve incluir uma forma de alternar entre as diferentes condições climáticas. O JavaScript deve incluir uma maneira de alternar entre as diferentes condições climáticas.
Nesse teste, oGLM-4.5
O desempenho do cartão é muito melhor. Os cartões gerados não são apenas animados com suavidade, mas também mais refinados nos detalhes da interface do usuário (UI), e o design geral é mais agradável esteticamente.
Teste 3: Cartões de conhecimento de estilo de revista de alta moda
Para avaliar ainda mais a capacidade do modelo em um alto nível de design e estética, foi introduzido um prompt mais especializado, exigindo que o modelo assumisse o papel de um importante diretor de arte de uma revista digital internacional, projetando um cartão de conhecimento futurista inspirado em tecnologia.
Palavras-chave do teste:
Você é um dos principais diretores de arte de revistas digitais internacionais e especialista em desenvolvimento front-end que projetou layouts digitais para revistas de moda, como Vogue e Elle, e é especializado em combinar a estética de revistas de luxo com o design moderno da Web para criar experiências visuais impressionantes.
mandatos
Use a Futuristic Tech para criar cartões de conhecimento no estilo de revista de alta moda, apresentando informações diárias em um layout de revista sofisticado e luxuoso, proporcionando aos usuários o prazer visual de folhear uma revista de alta qualidade.
- Área de data: apresenta a data atual de uma maneira exclusiva para cada estilo
- Títulos e subtítulos: ajuste as fontes, os tamanhos e a tipografia de acordo com o estilo
- Bloco de citação: crie um estilo de citação exclusivo, refletindo as características do estilo
- Lista de marcadores principais: apresentação do conteúdo da lista de maneira adequada ao estilo
- Nota/dica do editor: crie-o para se adequar ao estilo da barra lateral ou da anotação
Especificações técnicas:
* 使用HTML5、Font Awesome、Tailwind CSS和必要的JavaScript
* FontAwesome: [https://lf6-cdn-tos.bytecdntp.com/cdn/expire-100-M/font-awesome/6.0.0/css/all.min.css](https://lf6-cdn-tos.bytecdntp.com/cdn/expire-100-M/font-awesome/6.0.0/css/all.min.css)
* Tailwind CSS: <https://lf3-cdn-tos.bytecdntp.com/cdn/expire-1-M/tailwindcss/2.2.19/tailwind.min.css>
* 中文字体: [https://fonts.geekzu.org/css2?family=Noto+Serif+SC:wght@400;500;600;700&family=Noto+Sans+SC:wght@300;400;500;700&display=swap](https://fonts.geekzu.org/css2?family=Noto+Serif+SC:wght@400;500;600;700&family=Noto+Sans+SC:wght@300;400;500;700&display=swap)
- Considere adicionar efeitos dinâmicos sutis, como um efeito de fade-in quando a página for carregada ou um feedback sutil ao passar o mouse.
- Garantir que o código seja limpo e eficiente, com foco no desempenho e na capacidade de manutenção
- Use variáveis CSS para gerenciar cores e espaçamento para obter consistência de estilo
- Para o estilo de morfismo digital líquido, devem ser adicionados efeitos dinâmicos fluidos e transições de gradiente
- Para um estilo minimalista ultrassensorial, cada pixel e feedback interativo sutil devem ser controlados com precisão
- Para o estilo de visualização de dados neoexpressionista, é importante incorporar os dados visualmente ao design
Requisitos de saída:
- O código deve ser elegante e estar em conformidade com as práticas recomendadas, e o CSS deve refletir a máxima atenção aos detalhes
- Projetado para uma largura de 440px e uma altura não superior a 1280px
- Abstrair e refinar o assunto, mostrando apenas os pontos de coluna ou as citações de frases mais centrais, tornando a leitura gratificante
- Sempre com a saída em chinês, os elementos decorativos podem ser usados em outros idiomas, como francês e inglês, para dar uma aparência impressionante.
Com a visão e os padrões estéticos de um dos principais diretores de arte de revistas internacionais, crie cartões no estilo de revistas digitais que sejam diferentes em estilo, mas igualmente impressionantes, para que os usuários possam sentir que "este não é apenas um cartão de informações comum, mas uma peça de arte digital colecionável".
Kimi K2
junto com Qwen3 Coder
Os resultados da geração são os seguintes:
Nessa comparação, oGLM-4.5
As vantagens se tornam ainda mais óbvias. O cartão que ele gera não só destaca efetivamente a sensação futurista por meio do fundo brilhante com um esquema de cores harmonioso, mas, o que é mais importante, é o único modelo que incorpora elementos interativos em seu design. Quando o mouse passa, o cartão tem o feedback correspondente, aprimorando a experiência do usuário.
Teste 4: Jogo 3D Bricks
O teste final é uma tarefa complexa que exige que o modelo seja testado usando o Three.js
Crie um jogo 3D de quebra de tijolos totalmente controlado pelo mouse que examine a capacidade do modelo de lidar com uma combinação de lógica de jogo, mecanismo de física e efeitos visuais.
Palavras-chave do teste:
"Crie um jogo de quebra de tijolos em 3D controlado inteiramente pelo mouse:
- Use o Three.js para criar uma cena 3D imersiva com os seguintes componentes principais: uma raquete de jogador deslizante da esquerda para a direita: controlada pelo movimento horizontal do mouse; uma esfera saltitante com propriedades físicas: velocidade inicial moderada, seguindo a lei da reflexão após a colisão; e fileiras de tijolos coloridos que pairam: cores diferentes correspondem a pontuações diferentes.
- Requisitos de efeito físico: detecção de colisão: colisão precisa da esfera com tijolos/barreiras/limites; rebote dinâmico: a colisão em diferentes posições da barreira altera o ângulo de rebote horizontal da bola; simulação de gravidade: a trajetória da esfera tem a forma de uma parábola natural.
- Mecânica do jogo: Sistema de pontuação: pontuação em tempo real para quebrar tijolos (tijolos normais = 10 pontos, tijolos dourados = 50 pontos); Valor de vida: 3 vidas iniciais, a vida será deduzida se a bola cair no fundo; Evolução da velocidade: para cada 10 tijolos quebrados, a velocidade da bola será aumentada em 15%
- Efeitos visuais: efeito de explosão de partículas acionado quando os tijolos são esmagados; efeito de luz de arrasto dinâmico adicionado à trajetória da esfera; animação de onda de choque em forma de anel aparece quando o defletor colide.
- Aprimoramentos de interação: exibição em tempo real da pontuação e do valor de vida no HUD; tela de fim de jogo mostrando a pontuação final + botão de reinício; adição de efeitos sonoros de colisão (usando a API de áudio da Web)"
Em termos de realização finalGLM-4.5
Os jogos gerados eram os mais jogáveis, tinham a maior integridade da lógica do jogo e geravam o menor número de bugs, comprovando mais uma vez sua capacidade de liderança para lidar com tarefas complexas de geração de código.
Em conjunto.GLM-4.5
Ele demonstrou uma forte combinação de pontos fortes na geração de código, especialmente para tarefas que combinam estética de design e interações complexas. Sua taxa de sucesso única na geração de código e sua capacidade de controlar detalhes fazem dele um modelo de código aberto de alto desempenho digno da atenção dos desenvolvedores.