当前位置：首页 » AI新闻

GLM-4.5 开源发布：面向智能体应用的新一代旗舰模型

2025-07-28

1.2 K

智谱 AI 近日发布了其新一代旗舰基础模型 GLM-4.5，该模型专为智能体（Agent）应用设计，并在 Hugging Face 和 ModelScope 平台同步开源，其模型权重遵循 MIT 许可证。

该模型系列采用了混合专家（MoE）架构，包含两个版本：GLM-4.5 总参数量为 3550 亿，激活参数 320 亿；GLM-4.5-Air 总参数量为 1060 亿，激活参数 120 亿。MoE 架构允许模型在推理时仅激活一部分专家网络，从而在保持庞大知识规模的同时，显著降低实际计算开销，这也是该模型能够实现高效率的关键。

此外，模型提供两种运行模式：为复杂推理和工具调用设计的“思考模式”，以及为即时响应设计的“非思考模式”。在成本方面，其 API 定价极具竞争力，高速版生成速度最高可达 100 tokens/秒。

综合性能表现

GLM-4.5 的目标是在单个模型中原生融合推理、编码和智能体能力。为了全面评估其通用能力，开发团队选取了 12 个行业代表性的评测基准，涵盖了从专业知识（MMLU Pro、AIME24）、代码生成（SWE-Bench Verified）到复杂推理（GPQA）的多个维度。

图：GLM-4.5在12个综合基准评测中的表现

在这些基准测试的综合平均分中，GLM-4.5 在全球范围内的模型中位列第三，并在开源模型中排名第一。根据官方信息，该模型在 15 万亿 token 的通用数据上完成预训练后，又在代码、推理和智能体领域的 8 万亿 token 数据上进行了针对性训练，最终通过强化学习进行能力增强。

更高的参数效率

在参数效率方面，GLM-4.5 展示了其架构优势。尽管其参数量低于 DeepSeek-R1 和 Kimi-K2 等模型，但在多项基准测试中表现更优。

尤其在衡量模型解决实际软件工程问题能力的 SWE-Bench Verified 榜单上，GLM-4.5 系列位于性能与参数比的“帕累托前沿”。这意味着在同等参数规模下，该系列模型实现了当前最佳的性能表现。

图：模型在SWE-bench Verified榜单上的性能/参数比

成本与速度

除了性能，GLM-4.5 系列在成本和效率上也实现了突破。其 API 调用价格低至输入 0.8 元/百万 tokens，输出 2 元/百万 tokens，这一定价远低于市场上部分主流模型。同时，高速版本最高可达 100 tokens/秒的生成速度，能够满足低延迟、高并发的实际部署需求。

图：主流模型API定价对比

真实场景测试

为了评估 GLM-4.5 在真实编程场景中的效果，研发团队将其接入 Claude Code 框架，与 Claude-4-Sonnet、Kimi-K2、Qwen3-Coder 等模型在 52 个覆盖六大开发领域的编程任务中进行了对比。

图：真实代码智能体场景对比测试结果

测试结果显示，GLM-4.5 相比其他开源模型在工具调用的可靠性和任务完成度上表现突出，在多数场景下可作为 Claude-4-Sonnet 的有效替代方案，但整体能力仍有提升空间。为保证评测的透明度，所有测试任务及智能体轨迹均已公开。

模型原生 Agent 场景

全栈开发

GLM-4.5 系列具备执行全栈开发任务的能力，能够通过自然语言指令编写较为复杂的应用程序、游戏和交互式网页。开发团队展示了多个仅通过一句指令生成的应用案例，这些应用目前已在 Z.ai 网站上线，供用户免费体验。

示例一：构建一个搜索引擎

指令： “做一个Google搜索网站。”
体验地址： https://n0x9f6733jm1-deploy.space.z.ai

示例二：开发一个视频网站

指令： “开发一个包含 UI 的 bilibili 网页端 Demo，页面包括：首页与视频详情页…”
体验地址： https://n0dba6ce0e60-deploy.space.z.ai

示例三：开发一个社交媒体网站

指令： “开发一个包含 UI 的微博网页端 Demo，页面包括：首页与个人主页…”
体验地址： https://v0rb06rruyf0-deploy.space.z.ai/

Artifacts 效果

模型不仅擅长代码处理，也能进行数据处理和交互式内容生成。例如，通过一条英文指令，模型可以利用 Three.js 和 JavaScript 创建一个 3D 可视化地球仪，或制作一个 Flappy Bird 风格的小游戏。

示例：Flappy Bird 小游戏

指令： “Build a webpage using Three.js and JavaScript that creates a 3D world displaying places I’ve visited, based on an array. Clicking markers on the 3D globe will animate a zoom effect and open detailed trip information with photos.”
体验地址： https://chat.z.ai/space/b0yb2613ybp0-art

PPT 制作

GLM-4.5 还展示了在图文内容创作方面的能力。与传统 AI PPT 工具依赖模板填充不同，该模型在制作过程中会自主搜索资料、查找配图，并直接以 HTML 形式生成内容。这使得它可以灵活创作不同比例的演示文稿、社交媒体图片或简历。

如何使用

GLM-4.5 深度优化了全栈编程与工具调用能力，兼容 Claude Code、Cline、Roo Code 等主流代码智能体框架。

开源仓库: https://github.com/zai-org/GLM-4.5
模型仓库:
- HuggingFace: https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
- ModelScope: https://modelscope.cn/collections/GLM-45-b8693e2a08984f
在线体验:
- HuggingFace: https://huggingface.co/spaces/zai-org/GLM-4.5-Space
- ModelScope: https://modelscope.cn/studios/ZhipuAI/GLM-4.5-Demo

未经允许不得转载：AI生产力工具 » GLM-4.5 开源发布：面向智能体应用的新一代旗舰模型