A Smart Spectrum AI lançou recentemente a próxima geração de seu principal modelo básico GLM-4.5
O modelo foi projetado para aplicativos de corpo inteligente (agente) e está em Hugging Face
responder cantando ModelScope
A plataforma é de código aberto de forma síncrona e seus pesos de modelo seguem a licença MIT.
A família de modelos usa uma arquitetura Mixed Expert (MoE) e contém duas versões:GLM-4.5
O número total de participantes é de 355 bilhões, com 32 bilhões de parâmetros de ativação;GLM-4.5-Air
O número total de participantes é de 106 bilhões, com 12 bilhões de parâmetros de ativação.MoE
A arquitetura permite que o modelo ative apenas uma parte da rede de especialistas durante a inferência, reduzindo significativamente a sobrecarga computacional real e mantendo a grande escala de conhecimento, que é a chave para a alta eficiência que o modelo é capaz de alcançar.
Além disso, o modelo oferece dois modos de operação: um "modo de pensamento" projetado para raciocínio complexo e invocação de ferramentas, e um "modo de não pensamento" projetado para resposta imediata. Em termos de custo, a API tem um preço competitivo, com versões de alta velocidade geradas em até 100%. tokens/秒
.
Desempenho geral
GLM-4.5
O objetivo é fundir de forma nativa os recursos de raciocínio, codificação e corpo inteligente em um único modelo. Para avaliar completamente seus recursos gerais, a equipe de desenvolvimento selecionou 12 benchmarks de análise representativos do setor que abrangem tudo, desde experiência (MMLU Pro
eAIME24
), geração de código (SWE-Bench Verified
) até o raciocínio complexo (GPQA
) em várias dimensões.
Figura: Desempenho do GLM-4.5 em 12 análises abrangentes de benchmark
Nas pontuações médias combinadas desses testes de benchmark, oGLM-4.5
Ele está classificado em terceiro lugar entre os modelos em todo o mundo e em primeiro lugar entre os modelos de código aberto. De acordo com informações oficiais, o modelo está em 15 trilhões de dólares. token
Depois de concluir o pré-treinamento sobre os dados de uso geral no campo de código, raciocínio e inteligência nos 8 trilhões de dólares, a empresa está pronta para o treinamento. token
Os dados foram direcionados para treinamento, culminando com o aprimoramento da competência por meio de aprendizado intensivo.
Maior eficiência dos parâmetros
Em termos de eficiência paramétrica, oGLM-4.5
demonstra as vantagens de sua arquitetura. Embora seu número de parâmetros seja menor do que DeepSeek-R1
responder cantando Kimi-K2
e outros modelos, mas apresenta melhor desempenho em vários benchmarks.
Especialmente para medir a capacidade dos modelos de resolver problemas reais de engenharia de software, o SWE-Bench Verified
No topo da lista.GLM-4.5
A série está na "fronteira de Pareto" das relações entre desempenho e parâmetros. Isso significa que os modelos da série alcançam o melhor desempenho disponível para a mesma escala de parâmetros.
Figura: relação desempenho/parâmetro do modelo na lista de verificação do SWE-bench
Custo e velocidade
Além do desempenho.GLM-4.5
A série também é um avanço em termos de custo e eficiência. O preço das chamadas de API é tão baixo quanto US$ 0,8 por milhão de entrada. tokens
Produção $2/milhão tokens
Esse preço é muito mais baixo do que o de alguns dos principais modelos do mercado. Enquanto isso, as versões de alta velocidade estão disponíveis em até 100 tokens/秒
A velocidade de geração é capaz de atender aos requisitos reais de implementação de baixa latência e alta simultaneidade.
Figura: Comparação de preços de API para modelos convencionais
Testes em cenas reais
Para avaliar GLM-4.5
em cenários reais de programação, a equipe de P&D o inseriu no Claude Code
Estrutura, com Claude-4-Sonnet
eKimi-K2
eQwen3-Coder
Os modelos et foram comparados em 52 tarefas de programação que abrangem seis domínios de desenvolvimento.
Fig.: Resultados do teste de comparação de cenários de corpos inteligentes com código real
Os resultados do teste mostraram queGLM-4.5
Ele se destaca pela confiabilidade da invocação da ferramenta e da conclusão da tarefa em comparação com outros modelos de código aberto, e pode ser usado como uma ferramenta para a maioria dos cenários Claude-4-Sonnet
de alternativas eficazes, mas ainda há espaço para melhorias na capacidade geral. Para garantir a transparência da avaliação, todas as tarefas de teste e trajetórias de corpos inteligentes foram tornadas públicas.
Cena do agente nativo modelo
desenvolvedor full-stack
GLM-4.5
A série tem a capacidade de executar tarefas de desenvolvimento de pilha completa, permitindo que aplicativos mais complexos, jogos e páginas da Web interativas sejam escritos usando comandos de linguagem natural. A equipe de desenvolvimento demonstrou vários exemplos de aplicativos gerados com apenas um comando, que agora estão disponíveis no Z.ai
O site está on-line para os usuários experimentarem gratuitamente.
Exemplo 1: Criação de um mecanismo de pesquisa
Instruções: "Crie um site de pesquisa do Google".
Endereço de experiência: https://n0x9f6733jm1-deploy.space.z.ai
Exemplo 2: Desenvolvimento de um site de vídeo
Instruções: "Desenvolva uma demonstração da web bilíngue com interface do usuário, as páginas incluem: página inicial e detalhes do vídeo..."
Endereço de experiência: https://n0dba6ce0e60-deploy.space.z.ai
Exemplo 3: Desenvolvimento de um site de mídia social
Instruções: "Desenvolva uma demonstração do Weibo na Web com interface do usuário, as páginas incluem: página inicial e perfil..."
Endereço de experiência: https://v0rb06rruyf0-deploy.space.z.ai/
Efeitos dos artefatos
Os modelos não são bons apenas no processamento de códigos, mas também no processamento de dados e na geração de conteúdo interativo. Por exemplo, com um comando em inglês, um modelo pode utilizar a função Three.js
responder cantando JavaScript
Criar um 3D
Visualize um globo ou faça um Flappy Bird
Minijogos de estilo.
Exemplo: minijogo Flappy Bird
Instruções: "Crie uma página da Web usando Three.js e JavaScript que crie um mundo 3D exibindo os lugares que visitei, com base em uma matriz. Clicar em marcadores no globo 3D animará um efeito de zoom e abrirá informações detalhadas sobre a viagem com fotos."
Endereço de experiência: https://chat.z.ai/space/b0yb2613ybp0-art
Produção de PPT
GLM-4.5
Ele também demonstrou sua capacidade de criação de conteúdo gráfico. Diferentemente das ferramentas tradicionais de PPT com IA que dependem de modelos a serem preenchidos, o modelo busca informações de forma autônoma, encontra as imagens que as acompanham e gera conteúdo diretamente em HTML durante o processo de produção. Isso lhe dá flexibilidade para criar apresentações, imagens de mídia social ou currículos em diferentes escalas.
Como usar
GLM-4.5
Profundamente otimizado para programação de pilha completa e recursos de chamada de ferramentas, compatível com o Claude Code
eCline
eRoo Code
e outras estruturas principais de corpo de inteligência de código.
- Repositório de código aberto.
https://github.com/zai-org/GLM-4.5
- Armazém de modelos.
HuggingFace
:https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
ModelScope
:https://modelscope.cn/collections/GLM-45-b8693e2a08984f
- Experiência on-line.
HuggingFace
:https://huggingface.co/spaces/zai-org/GLM-4.5-Space
ModelScope
:https://modelscope.cn/studios/ZhipuAI/GLM-4.5-Demo