GLM-4.5オープンソースリリース：インテリジェントボディアプリケーションのための新世代のフラッグシップモデル

2025-07-28

1.2 K

Smart Spectrum AIはこのほど、主力ベースモデルの次世代モデルを発表した。 GLM-4.5このモデルは、インテリジェント・ボディ（エージェント）のアプリケーション用に設計されており、次のような特徴がある。 Hugging Face 和 ModelScope このプラットフォームは同期的にオープンソースであり、そのモデル・ウエイトはMITライセンスに従っている。

このモデルファミリーはミックスド・エキスパート（MoE）アーキテクチャを採用しており、2つのバージョンがある：GLM-4.5 参加者の総数は3,550億人で、活性化パラメータは320億個である；GLM-4.5-Air 参加者の総数は1060億人で、120億の活性化パラメーターがある。MoE このアーキテクチャは、推論中にエキスパートネットワークの一部のみをアクティブにすることを可能にし、その結果、モデルが達成できる高効率の鍵である大規模な知識スケールを維持しながら、実際の計算オーバーヘッドを大幅に削減する。

加えて、このモデルは2つの動作モードを提供する。複雑な推論とツール呼び出しのために設計された「思考モード」と、即時応答のために設計された「非思考モード」である。コスト面では、APIは競争力のある価格設定となっており、高速バージョンでは最大100パーセントで生成される。 tokens/秒。

総合成績

GLM-4.5 その目標は、推論、コーディング、インテリジェント・ボディの能力を一つのモデルにネイティブに融合させることである。その一般的な能力を完全に評価するために、開発チームは、専門知識 (MMLU Pro、AIME24)、コード生成(SWE-Bench Verified)から複雑な推論(GPQA)を多次元で表現している。

図：GLM-4.5の12の包括的ベンチマークレビューにおけるパフォーマンス

これらのベンチマークテストの平均点を合計すると、以下のようになる。GLM-4.5 世界では3位、オープンソースでは1位である。公式情報によると、このモデルは15兆円規模である。 token 8兆のコード、推論、インテリジェンス分野の汎用データで事前トレーニングを完了した後 token そのデータはトレーニングの対象となり、集中的な学習を通じてコンピテンシーを高めることに結実した。

より高いパラメータ効率

パラメトリックな効率という点ではGLM-4.5 は、そのアーキテクチャの利点を示している。パラメータ数は DeepSeek-R1 和 Kimi-K2 などのモデルがあるが、いくつかのベンチマークではこちらの方が優れている。

特に、実際のソフトウェア工学の問題を解決するモデルの能力を測定する際には SWE-Bench Verified リストのトップGLM-4.5 このシリーズは、パラメータ比に対する性能の「パレート・フロンティア」に位置している。つまり、このシリーズのモデルは、同じパラメータスケールで利用可能な最高のパフォーマンスを達成している。

図：SWEベンチ検証済みリストにおけるモデルの性能/パラメータ比

コストとスピード

パフォーマンスに加えて。GLM-4.5 このシリーズはコストと効率においても画期的である。APIコールの価格は、100万入力あたり0.8ドルという低さだ。 tokens生産高 200万ドル tokensこの価格設定は、市場で主流となっているいくつかのモデルよりもはるかに安い。一方、高速タイプは最大100 tokens/秒生成速度は、低遅延と高同時性という実際の配備要件を満たすことができる。

図：主流モデルのAPI価格比較

リアル・シーン・テスト

を評価する。 GLM-4.5 R&Dチームは、実際のプログラミング・シナリオにこの機能を組み込んだ。 Claude Code フレームワーク Claude-4-Sonnet、Kimi-K2、Qwen3-Coder らのモデルは、6つの開発領域をカバーする52のプログラミングタスクで比較された。

図：実コードスマートボディシナリオの比較テスト結果

テスト結果は以下の通りであった。GLM-4.5 他のオープンソースモデルと比較して、ツール起動とタスク完了の信頼性に優れており、ほとんどのシナリオでツールとして使用できる。 Claude-4-Sonnet しかし、全体的な能力にはまだ改善の余地がある。評価の透明性を確保するため、すべてのテストタスクとインテリジェントボディの軌道は公開されている。

モデル・ネイティブ・エージェント・シーン

フルスタックデベロッパー

GLM-4.5 このシリーズはフルスタックの開発タスクを実行する能力を備えており、より複雑なアプリケーション、ゲーム、インタラクティブなウェブページを自然言語コマンドを使って書くことができる。開発チームは、たった1つのコマンドで生成されたアプリケーションの例をいくつかデモンストレーションした。 Z.ai ウェブサイトはオンラインで、ユーザーは無料で体験できる。

例1：検索エンジンの構築

指示する： "グーグル検索サイトを作ろう"
住所 https://n0x9f6733jm1-deploy.space.z.ai

例2：ビデオウェブサイトの開発

指示する： "UIを備えたbilibiliのウェブ・デモを開発してください。
住所 https://n0dba6ce0e60-deploy.space.z.ai

例3：ソーシャルメディア・サイトの開発

指示する： "WeiboのウェブデモをUIで開発する。
住所 https://v0rb06rruyf0-deploy.space.z.ai/

アーティファクト効果

モデルはコード処理だけでなく、データ処理やインタラクティブなコンテンツ生成も得意とする。例えば、英語のコマンドを使えば、モデルは Three.js 和 JavaScript を作成する。 3D 地球儀を思い浮かべる。 Flappy Bird ミニゲームのスタイル

例：フラッピーバードのミニゲーム

指示する： "Three.jsとJavaScriptを使って、配列に基づいて私が訪れた場所を表示する3Dの世界を作るウェブページを作る。3D地球儀上のマーカーをクリックすると、ズーム効果がアニメーションし、写真付きの詳細な旅行情報が開きます。"
住所 https://chat.z.ai/space/b0yb2613ybp0-art

PPT制作

GLM-4.5 また、グラフィック・コンテンツ作成においてもその能力を発揮した。テンプレートへの入力に依存する従来のAI PPTツールとは異なり、このモデルは自律的に情報を検索し、付随する画像を見つけ、制作プロセス中にHTMLで直接コンテンツを生成する。これにより、プレゼンテーション、ソーシャルメディア用画像、履歴書など、さまざまなスケールのコンテンツを柔軟に作成することができる。

使用方法

GLM-4.5 フルスタック・プログラミングとツール・コール機能のために深く最適化され、以下のものと互換性がある。 Claude Code、Cline、Roo Code など、主流のコード・インテリジェンス・ボディ・フレームワークがある。

オープンソースのリポジトリ。 https://github.com/zai-org/GLM-4.5
模型仓库:
- HuggingFace: https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
- ModelScope: https://modelscope.cn/collections/GLM-45-b8693e2a08984f
在线体验:
- HuggingFace: https://huggingface.co/spaces/zai-org/GLM-4.5-Space
- ModelScope: https://modelscope.cn/studios/ZhipuAI/GLM-4.5-Demo

GLM-4.5オープンソースリリース：インテリジェントボディアプリケーションのための新世代のフラッグシップモデル