Acesso no exterior: www.kdjingpai.com
Ctrl + D Marcar este site como favorito

Versão de código aberto do GLM-4.5: uma nova geração de modelos emblemáticos para aplicativos de corpos inteligentes

2025-07-28 30

Imagem

A Smart Spectrum AI lançou recentemente a próxima geração de seu principal modelo básico GLM-4.5O modelo foi projetado para aplicativos de corpo inteligente (agente) e está em Hugging Face responder cantando ModelScope A plataforma é de código aberto de forma síncrona e seus pesos de modelo seguem a licença MIT.

A família de modelos usa uma arquitetura Mixed Expert (MoE) e contém duas versões:GLM-4.5 O número total de participantes é de 355 bilhões, com 32 bilhões de parâmetros de ativação;GLM-4.5-Air O número total de participantes é de 106 bilhões, com 12 bilhões de parâmetros de ativação.MoE A arquitetura permite que o modelo ative apenas uma parte da rede de especialistas durante a inferência, reduzindo significativamente a sobrecarga computacional real e mantendo a grande escala de conhecimento, que é a chave para a alta eficiência que o modelo é capaz de alcançar.

Além disso, o modelo oferece dois modos de operação: um "modo de pensamento" projetado para raciocínio complexo e invocação de ferramentas, e um "modo de não pensamento" projetado para resposta imediata. Em termos de custo, a API tem um preço competitivo, com versões de alta velocidade geradas em até 100%. tokens/秒.

Desempenho geral

GLM-4.5 O objetivo é fundir de forma nativa os recursos de raciocínio, codificação e corpo inteligente em um único modelo. Para avaliar completamente seus recursos gerais, a equipe de desenvolvimento selecionou 12 benchmarks de análise representativos do setor que abrangem tudo, desde experiência (MMLU ProeAIME24), geração de código (SWE-Bench Verified) até o raciocínio complexo (GPQA) em várias dimensões.

Imagem
Figura: Desempenho do GLM-4.5 em 12 análises abrangentes de benchmark

Nas pontuações médias combinadas desses testes de benchmark, oGLM-4.5 Ele está classificado em terceiro lugar entre os modelos em todo o mundo e em primeiro lugar entre os modelos de código aberto. De acordo com informações oficiais, o modelo está em 15 trilhões de dólares. token Depois de concluir o pré-treinamento sobre os dados de uso geral no campo de código, raciocínio e inteligência nos 8 trilhões de dólares, a empresa está pronta para o treinamento. token Os dados foram direcionados para treinamento, culminando com o aprimoramento da competência por meio de aprendizado intensivo.

Maior eficiência dos parâmetros

Em termos de eficiência paramétrica, oGLM-4.5 demonstra as vantagens de sua arquitetura. Embora seu número de parâmetros seja menor do que DeepSeek-R1 responder cantando Kimi-K2 e outros modelos, mas apresenta melhor desempenho em vários benchmarks.

Especialmente para medir a capacidade dos modelos de resolver problemas reais de engenharia de software, o SWE-Bench Verified No topo da lista.GLM-4.5 A série está na "fronteira de Pareto" das relações entre desempenho e parâmetros. Isso significa que os modelos da série alcançam o melhor desempenho disponível para a mesma escala de parâmetros.

Imagem
Figura: relação desempenho/parâmetro do modelo na lista de verificação do SWE-bench

Custo e velocidade

Além do desempenho.GLM-4.5 A série também é um avanço em termos de custo e eficiência. O preço das chamadas de API é tão baixo quanto US$ 0,8 por milhão de entrada. tokensProdução $2/milhão tokensEsse preço é muito mais baixo do que o de alguns dos principais modelos do mercado. Enquanto isso, as versões de alta velocidade estão disponíveis em até 100 tokens/秒A velocidade de geração é capaz de atender aos requisitos reais de implementação de baixa latência e alta simultaneidade.

Imagem
Figura: Comparação de preços de API para modelos convencionais

Testes em cenas reais

Para avaliar GLM-4.5 em cenários reais de programação, a equipe de P&D o inseriu no Claude Code Estrutura, com Claude-4-SonneteKimi-K2eQwen3-Coder Os modelos et foram comparados em 52 tarefas de programação que abrangem seis domínios de desenvolvimento.

Imagem
Fig.: Resultados do teste de comparação de cenários de corpos inteligentes com código real

Os resultados do teste mostraram queGLM-4.5 Ele se destaca pela confiabilidade da invocação da ferramenta e da conclusão da tarefa em comparação com outros modelos de código aberto, e pode ser usado como uma ferramenta para a maioria dos cenários Claude-4-Sonnet de alternativas eficazes, mas ainda há espaço para melhorias na capacidade geral. Para garantir a transparência da avaliação, todas as tarefas de teste e trajetórias de corpos inteligentes foram tornadas públicas.

Cena do agente nativo modelo

desenvolvedor full-stack

GLM-4.5 A série tem a capacidade de executar tarefas de desenvolvimento de pilha completa, permitindo que aplicativos mais complexos, jogos e páginas da Web interativas sejam escritos usando comandos de linguagem natural. A equipe de desenvolvimento demonstrou vários exemplos de aplicativos gerados com apenas um comando, que agora estão disponíveis no Z.ai O site está on-line para os usuários experimentarem gratuitamente.

Exemplo 1: Criação de um mecanismo de pesquisa

Instruções: "Crie um site de pesquisa do Google".
Endereço de experiência: https://n0x9f6733jm1-deploy.space.z.ai

Exemplo 2: Desenvolvimento de um site de vídeo

Instruções: "Desenvolva uma demonstração da web bilíngue com interface do usuário, as páginas incluem: página inicial e detalhes do vídeo..."
Endereço de experiência: https://n0dba6ce0e60-deploy.space.z.ai

Exemplo 3: Desenvolvimento de um site de mídia social

Instruções: "Desenvolva uma demonstração do Weibo na Web com interface do usuário, as páginas incluem: página inicial e perfil..."
Endereço de experiência: https://v0rb06rruyf0-deploy.space.z.ai/

Efeitos dos artefatos

Os modelos não são bons apenas no processamento de códigos, mas também no processamento de dados e na geração de conteúdo interativo. Por exemplo, com um comando em inglês, um modelo pode utilizar a função Three.js responder cantando JavaScript Criar um 3D Visualize um globo ou faça um Flappy Bird Minijogos de estilo.

Exemplo: minijogo Flappy Bird

Instruções: "Crie uma página da Web usando Three.js e JavaScript que crie um mundo 3D exibindo os lugares que visitei, com base em uma matriz. Clicar em marcadores no globo 3D animará um efeito de zoom e abrirá informações detalhadas sobre a viagem com fotos."
Endereço de experiência: https://chat.z.ai/space/b0yb2613ybp0-art

Produção de PPT

GLM-4.5 Ele também demonstrou sua capacidade de criação de conteúdo gráfico. Diferentemente das ferramentas tradicionais de PPT com IA que dependem de modelos a serem preenchidos, o modelo busca informações de forma autônoma, encontra as imagens que as acompanham e gera conteúdo diretamente em HTML durante o processo de produção. Isso lhe dá flexibilidade para criar apresentações, imagens de mídia social ou currículos em diferentes escalas.

fotografia
fotografia
fotografia
fotografia
fotografia
fotografia
fotografia
fotografia
fotografia

Como usar

GLM-4.5 Profundamente otimizado para programação de pilha completa e recursos de chamada de ferramentas, compatível com o Claude CodeeClineeRoo Code e outras estruturas principais de corpo de inteligência de código.

  • Repositório de código aberto. https://github.com/zai-org/GLM-4.5
  • Armazém de modelos.
    • HuggingFacehttps://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
    • ModelScopehttps://modelscope.cn/collections/GLM-45-b8693e2a08984f
  • Experiência on-line.
    • HuggingFacehttps://huggingface.co/spaces/zai-org/GLM-4.5-Space
    • ModelScopehttps://modelscope.cn/studios/ZhipuAI/GLM-4.5-Demo

Recomendado

Não consegue encontrar ferramentas de IA? Tente aqui!

Basta digitar a palavra-chave Acessibilidade Bing SearchA seção Ferramentas de IA deste site é uma maneira rápida e fácil de encontrar todas as ferramentas de IA deste site.

caixa de entrada

Entre em contato conosco

voltar ao topo

pt_BRPortuguês do Brasil