Smart Spectrum AIはこのほど、主力ベースモデルの次世代モデルを発表した。 GLM-4.5
このモデルは、インテリジェント・ボディ(エージェント)のアプリケーション用に設計されており、次のような特徴がある。 Hugging Face
歌で応える ModelScope
このプラットフォームは同期的にオープンソースであり、そのモデル・ウエイトはMITライセンスに従っている。
このモデルファミリーはミックスド・エキスパート(MoE)アーキテクチャを採用しており、2つのバージョンがある:GLM-4.5
参加者の総数は3,550億人で、活性化パラメータは320億個である;GLM-4.5-Air
参加者の総数は1060億人で、120億の活性化パラメーターがある。MoE
このアーキテクチャは、推論中にエキスパートネットワークの一部のみをアクティブにすることを可能にし、その結果、モデルが達成できる高効率の鍵である大規模な知識スケールを維持しながら、実際の計算オーバーヘッドを大幅に削減する。
加えて、このモデルは2つの動作モードを提供する。複雑な推論とツール呼び出しのために設計された「思考モード」と、即時応答のために設計された「非思考モード」である。コスト面では、APIは競争力のある価格設定となっており、高速バージョンでは最大100パーセントで生成される。 tokens/秒
.
総合成績
GLM-4.5
その目標は、推論、コーディング、インテリジェント・ボディの能力を一つのモデルにネイティブに融合させることである。その一般的な能力を完全に評価するために、開発チームは、専門知識 (MMLU Pro
そしてAIME24
)、コード生成(SWE-Bench Verified
)から複雑な推論(GPQA
)を多次元で表現している。
図:GLM-4.5の12の包括的ベンチマークレビューにおけるパフォーマンス
これらのベンチマークテストの平均点を合計すると、以下のようになる。GLM-4.5
世界では3位、オープンソースでは1位である。公式情報によると、このモデルは15兆円規模である。 token
8兆のコード、推論、インテリジェンス分野の汎用データで事前トレーニングを完了した後 token
そのデータはトレーニングの対象となり、集中的な学習を通じてコンピテンシーを高めることに結実した。
より高いパラメータ効率
パラメトリックな効率という点ではGLM-4.5
は、そのアーキテクチャの利点を示している。パラメータ数は DeepSeek-R1
歌で応える Kimi-K2
などのモデルがあるが、いくつかのベンチマークではこちらの方が優れている。
特に、実際のソフトウェア工学の問題を解決するモデルの能力を測定する際には SWE-Bench Verified
リストのトップGLM-4.5
このシリーズは、パラメータ比に対する性能の「パレート・フロンティア」に位置している。つまり、このシリーズのモデルは、同じパラメータスケールで利用可能な最高のパフォーマンスを達成している。
図:SWEベンチ検証済みリストにおけるモデルの性能/パラメータ比
コストとスピード
パフォーマンスに加えて。GLM-4.5
このシリーズはコストと効率においても画期的である。APIコールの価格は、100万入力あたり0.8ドルという低さだ。 tokens
生産高 200万ドル tokens
この価格設定は、市場で主流となっているいくつかのモデルよりもはるかに安い。一方、高速タイプは最大100 tokens/秒
生成速度は、低遅延と高同時性という実際の配備要件を満たすことができる。
図:主流モデルのAPI価格比較
リアル・シーン・テスト
を評価する。 GLM-4.5
R&Dチームは、実際のプログラミング・シナリオにこの機能を組み込んだ。 Claude Code
フレームワーク Claude-4-Sonnet
そしてKimi-K2
そしてQwen3-Coder
らのモデルは、6つの開発領域をカバーする52のプログラミングタスクで比較された。
図:実コードスマートボディシナリオの比較テスト結果
テスト結果は以下の通りであった。GLM-4.5
他のオープンソースモデルと比較して、ツール起動とタスク完了の信頼性に優れており、ほとんどのシナリオでツールとして使用できる。 Claude-4-Sonnet
しかし、全体的な能力にはまだ改善の余地がある。評価の透明性を確保するため、すべてのテストタスクとインテリジェントボディの軌道は公開されている。
モデル・ネイティブ・エージェント・シーン
フルスタックデベロッパー
GLM-4.5
このシリーズはフルスタックの開発タスクを実行する能力を備えており、より複雑なアプリケーション、ゲーム、インタラクティブなウェブページを自然言語コマンドを使って書くことができる。開発チームは、たった1つのコマンドで生成されたアプリケーションの例をいくつかデモンストレーションした。 Z.ai
ウェブサイトはオンラインで、ユーザーは無料で体験できる。
例1:検索エンジンの構築
指示する: "グーグル検索サイトを作ろう"
住所 https://n0x9f6733jm1-deploy.space.z.ai
例2:ビデオウェブサイトの開発
指示する: "UIを備えたbilibiliのウェブ・デモを開発してください。
住所 https://n0dba6ce0e60-deploy.space.z.ai
例3:ソーシャルメディア・サイトの開発
指示する: "WeiboのウェブデモをUIで開発する。
住所 https://v0rb06rruyf0-deploy.space.z.ai/
アーティファクト効果
モデルはコード処理だけでなく、データ処理やインタラクティブなコンテンツ生成も得意とする。例えば、英語のコマンドを使えば、モデルは Three.js
歌で応える JavaScript
を作成する。 3D
地球儀を思い浮かべる。 Flappy Bird
ミニゲームのスタイル
例:フラッピーバードのミニゲーム
指示する: "Three.jsとJavaScriptを使って、配列に基づいて私が訪れた場所を表示する3Dの世界を作るウェブページを作る。3D地球儀上のマーカーをクリックすると、ズーム効果がアニメーションし、写真付きの詳細な旅行情報が開きます。"
住所 https://chat.z.ai/space/b0yb2613ybp0-art
PPT制作
GLM-4.5
また、グラフィック・コンテンツ作成においてもその能力を発揮した。テンプレートへの入力に依存する従来のAI PPTツールとは異なり、このモデルは自律的に情報を検索し、付随する画像を見つけ、制作プロセス中にHTMLで直接コンテンツを生成する。これにより、プレゼンテーション、ソーシャルメディア用画像、履歴書など、さまざまなスケールのコンテンツを柔軟に作成することができる。
使用方法
GLM-4.5
フルスタック・プログラミングとツール・コール機能のために深く最適化され、以下のものと互換性がある。 Claude Code
そしてCline
そしてRoo Code
など、主流のコード・インテリジェンス・ボディ・フレームワークがある。
- オープンソースのリポジトリ。
https://github.com/zai-org/GLM-4.5
- モデル倉庫。
HuggingFace
:https://huggingface.co/collections/zai-org/glm-45-687c621d34bda8c9e4bf503b
ModelScope
:https://modelscope.cn/collections/GLM-45-b8693e2a08984f
- オンライン経験。
HuggingFace
:https://huggingface.co/spaces/zai-org/GLM-4.5-Space
ModelScope
:https://modelscope.cn/studios/ZhipuAI/GLM-4.5-Demo