智谱 AI 近日发布了其新一代旗舰基础模型 GLM-4.5
,该模型专为智能体(Agent)应用设计,并在 Hugging Face
和 ModelScope
平台同步开源,其模型权重遵循 MIT 许可证。
该模型系列采用了混合专家(MoE)架构,包含两个版本:GLM-4.5
总参数量为 3550 亿,激活参数 320 亿;GLM-4.5-Air
总参数量为 1060 亿,激活参数 120 亿。MoE
架构允许模型在推理时仅激活一部分专家网络,从而在保持庞大知识规模的同时,显著降低实际计算开销,这也是该模型能够实现高效率的关键。
此外,模型提供两种运行模式:为复杂推理和工具调用设计的“思考模式”,以及为即时响应设计的“非思考模式”。在成本方面,其 API 定价极具竞争力,高速版生成速度最高可达 100 tokens/秒
。
综合性能表现
GLM-4.5
的目标是在单个模型中原生融合推理、编码和智能体能力。为了全面评估其通用能力,开发团队选取了 12 个行业代表性的评测基准,涵盖了从专业知识(MMLU Pro
、AIME24
)、代码生成(SWE-Bench Verified
)到复杂推理(GPQA
)的多个维度。
图:GLM-4.5在12个综合基准评测中的表现
在这些基准测试的综合平均分中,GLM-4.5
在全球范围内的模型中位列第三,并在开源模型中排名第一。根据官方信息,该模型在 15 万亿 token
的通用数据上完成预训练后,又在代码、推理和智能体领域的 8 万亿 token
数据上进行了针对性训练,最终通过强化学习进行能力增强。
更高的参数效率
在参数效率方面,GLM-4.5
展示了其架构优势。尽管其参数量低于 DeepSeek-R1
和 Kimi-K2
等模型,但在多项基准测试中表现更优。
尤其在衡量模型解决实际软件工程问题能力的 SWE-Bench Verified
榜单上,GLM-4.5
系列位于性能与参数比的“帕累托前沿”。这意味着在同等参数规模下,该系列模型实现了当前最佳的性能表现。
图:模型在SWE-bench Verified榜单上的性能/参数比
成本与速度
除了性能,GLM-4.5
系列在成本和效率上也实现了突破。其 API 调用价格低至输入 0.8 元/百万 tokens
,输出 2 元/百万 tokens
,这一定价远低于市场上部分主流模型。同时,高速版本最高可达 100 tokens/秒
的生成速度,能够满足低延迟、高并发的实际部署需求。
图:主流模型API定价对比
真实场景测试
为了评估 GLM-4.5
在真实编程场景中的效果,研发团队将其接入 Claude Code
框架,与 Claude-4-Sonnet
、Kimi-K2
、Qwen3-Coder
等模型在 52 个覆盖六大开发领域的编程任务中进行了对比。
图:真实代码智能体场景对比测试结果
测试结果显示,GLM-4.5
相比其他开源模型在工具调用的可靠性和任务完成度上表现突出,在多数场景下可作为 Claude-4-Sonnet
的有效替代方案,但整体能力仍有提升空间。为保证评测的透明度,所有测试任务及智能体轨迹均已公开。
模型原生 Agent 场景
全栈开发
GLM-4.5
系列具备执行全栈开发任务的能力,能够通过自然语言指令编写较为复杂的应用程序、游戏和交互式网页。开发团队展示了多个仅通过一句指令生成的应用案例,这些应用目前已在 Z.ai
网站上线,供用户免费体验。
示例一:构建一个搜索引擎
指令: “做一个Google搜索网站。”
体验地址: https://n0x9f6733jm1-deploy.space.z.ai
示例二:开发一个视频网站
指令: “开发一个包含 UI 的 bilibili 网页端 Demo,页面包括:首页与视频详情页…”
体验地址: https://n0dba6ce0e60-deploy.space.z.ai
示例三:开发一个社交媒体网站
指令: “开发一个包含 UI 的微博网页端 Demo,页面包括:首页与个人主页…”
体验地址: https://v0rb06rruyf0-deploy.space.z.ai/
Artifacts 效果
模型不仅擅长代码处理,也能进行数据处理和交互式内容生成。例如,通过一条英文指令,模型可以利用 Three.js
和 JavaScript
创建一个 3D
可视化地球仪,或制作一个 Flappy Bird
风格的小游戏。
示例:Flappy Bird 小游戏
指令: “Build a webpage using Three.js and JavaScript that creates a 3D world displaying places I’ve visited, based on an array. Clicking markers on the 3D globe will animate a zoom effect and open detailed trip information with photos.”
体验地址: https://chat.z.ai/space/b0yb2613ybp0-art
PPT 制作
GLM-4.5
还展示了在图文内容创作方面的能力。与传统 AI PPT 工具依赖模板填充不同,该模型在制作过程中会自主搜索资料、查找配图,并直接以 HTML 形式生成内容。这使得它可以灵活创作不同比例的演示文稿、社交媒体图片或简历。
如何使用
GLM-4.5
深度优化了全栈编程与工具调用能力,兼容 Claude Code
、Cline
、Roo Code
等主流代码智能体框架。
- 开源仓库:
https://github.com/zai-org/GLM-4.5
- 模型仓库:
HuggingFace
:https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
ModelScope
:https://modelscope.cn/collections/GLM-45-b8693e2a08984f
- 在线体验:
HuggingFace
:https://huggingface.co/spaces/zai-org/GLM-4.5-Space
ModelScope
:https://modelscope.cn/studios/ZhipuAI/GLM-4.5-Demo