海外访问:www.kdjingpai.com
Ctrl + D 收藏本站
当前位置:首页 » AI新闻

GLM-4.5 开源发布:面向智能体应用的新一代旗舰模型

2025-07-28 19

Image

智谱 AI 近日发布了其新一代旗舰基础模型 GLM-4.5,该模型专为智能体(Agent)应用设计,并在 Hugging Face 和 ModelScope 平台同步开源,其模型权重遵循 MIT 许可证。

该模型系列采用了混合专家(MoE)架构,包含两个版本:GLM-4.5 总参数量为 3550 亿,激活参数 320 亿;GLM-4.5-Air 总参数量为 1060 亿,激活参数 120 亿。MoE 架构允许模型在推理时仅激活一部分专家网络,从而在保持庞大知识规模的同时,显著降低实际计算开销,这也是该模型能够实现高效率的关键。

此外,模型提供两种运行模式:为复杂推理和工具调用设计的“思考模式”,以及为即时响应设计的“非思考模式”。在成本方面,其 API 定价极具竞争力,高速版生成速度最高可达 100 tokens/秒

综合性能表现

GLM-4.5 的目标是在单个模型中原生融合推理、编码和智能体能力。为了全面评估其通用能力,开发团队选取了 12 个行业代表性的评测基准,涵盖了从专业知识(MMLU ProAIME24)、代码生成(SWE-Bench Verified)到复杂推理(GPQA)的多个维度。

Image
图:GLM-4.5在12个综合基准评测中的表现

在这些基准测试的综合平均分中,GLM-4.5 在全球范围内的模型中位列第三,并在开源模型中排名第一。根据官方信息,该模型在 15 万亿 token 的通用数据上完成预训练后,又在代码、推理和智能体领域的 8 万亿 token 数据上进行了针对性训练,最终通过强化学习进行能力增强。

更高的参数效率

在参数效率方面,GLM-4.5 展示了其架构优势。尽管其参数量低于 DeepSeek-R1 和 Kimi-K2 等模型,但在多项基准测试中表现更优。

尤其在衡量模型解决实际软件工程问题能力的 SWE-Bench Verified 榜单上,GLM-4.5 系列位于性能与参数比的“帕累托前沿”。这意味着在同等参数规模下,该系列模型实现了当前最佳的性能表现。

Image
图:模型在SWE-bench Verified榜单上的性能/参数比

成本与速度

除了性能,GLM-4.5 系列在成本和效率上也实现了突破。其 API 调用价格低至输入 0.8 元/百万 tokens,输出 2 元/百万 tokens,这一定价远低于市场上部分主流模型。同时,高速版本最高可达 100 tokens/秒的生成速度,能够满足低延迟、高并发的实际部署需求。

Image
图:主流模型API定价对比

真实场景测试

为了评估 GLM-4.5 在真实编程场景中的效果,研发团队将其接入 Claude Code 框架,与 Claude-4-SonnetKimi-K2Qwen3-Coder 等模型在 52 个覆盖六大开发领域的编程任务中进行了对比。

Image
图:真实代码智能体场景对比测试结果

测试结果显示,GLM-4.5 相比其他开源模型在工具调用的可靠性和任务完成度上表现突出,在多数场景下可作为 Claude-4-Sonnet 的有效替代方案,但整体能力仍有提升空间。为保证评测的透明度,所有测试任务及智能体轨迹均已公开。

模型原生 Agent 场景

全栈开发

GLM-4.5 系列具备执行全栈开发任务的能力,能够通过自然语言指令编写较为复杂的应用程序、游戏和交互式网页。开发团队展示了多个仅通过一句指令生成的应用案例,这些应用目前已在 Z.ai 网站上线,供用户免费体验。

示例一:构建一个搜索引擎

指令: “做一个Google搜索网站。”
体验地址: https://n0x9f6733jm1-deploy.space.z.ai

示例二:开发一个视频网站

指令: “开发一个包含 UI 的 bilibili 网页端 Demo,页面包括:首页与视频详情页…”
体验地址: https://n0dba6ce0e60-deploy.space.z.ai

示例三:开发一个社交媒体网站

指令: “开发一个包含 UI 的微博网页端 Demo,页面包括:首页与个人主页…”
体验地址: https://v0rb06rruyf0-deploy.space.z.ai/

Artifacts 效果

模型不仅擅长代码处理,也能进行数据处理和交互式内容生成。例如,通过一条英文指令,模型可以利用 Three.js 和 JavaScript 创建一个 3D 可视化地球仪,或制作一个 Flappy Bird 风格的小游戏。

示例:Flappy Bird 小游戏

指令: “Build a webpage using Three.js and JavaScript that creates a 3D world displaying places I’ve visited, based on an array. Clicking markers on the 3D globe will animate a zoom effect and open detailed trip information with photos.”
体验地址: https://chat.z.ai/space/b0yb2613ybp0-art

PPT 制作

GLM-4.5 还展示了在图文内容创作方面的能力。与传统 AI PPT 工具依赖模板填充不同,该模型在制作过程中会自主搜索资料、查找配图,并直接以 HTML 形式生成内容。这使得它可以灵活创作不同比例的演示文稿、社交媒体图片或简历。

图片
图片
图片
图片
图片
图片
图片
图片
图片

如何使用

GLM-4.5 深度优化了全栈编程与工具调用能力,兼容 Claude CodeClineRoo Code 等主流代码智能体框架。

  • 开源仓库: https://github.com/zai-org/GLM-4.5
  • 模型仓库:
    • HuggingFacehttps://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
    • ModelScopehttps://modelscope.cn/collections/GLM-45-b8693e2a08984f
  • 在线体验:
    • HuggingFacehttps://huggingface.co/spaces/zai-org/GLM-4.5-Space
    • ModelScopehttps://modelscope.cn/studios/ZhipuAI/GLM-4.5-Demo

相关推荐

找不到AI工具?在这试试!

输入关键词,即可 无障碍访问 必应 搜索,快速找到本站所有 AI 工具。

邮箱

联系我们

回顶部

zh_CN简体中文