最近、Smart Spectrum AIは、次のように発表した。 GLM-4.5
シリーズのモデルがオープンソースに加わり、大規模言語モデルのオープンソースコミュニティが活性化しました。このオープンソースは、混合エキスパート(MoE)アーキテクチャに基づく2つのモデルを中心に構成されており、推論プロセス中にエキスパートの一部(すなわちニューラルネットワークの一部)のみをアクティブにすることで、計算コストを低く抑えながら、モデルの総パラメータサイズを効率的に拡張することができます。
発売されたのは2モデル:
- GLM-4.5-355B総参加者数は3,550億人、有効化された参加者数は320億人である。
- GLM-4.5-エアー参加者総数は1,060億人、活性化した参加者数は120億人である。
パラメトリックなスケールで。GLM-4.5
のデザインは、効率を追求していることがわかる。例えば、3,550億人という参加者総数は、およそ DeepSeek-R1
半分と Kimi-K2
分の1である。
業績ベンチマークと価格戦略
業績評価という点では。GLM-4.5
含む MMLU Pro
そしてAIME24
そしてMATH 500
歌で応える SWE-Bench Verified
を含む12の公開ベンチマークで好成績を収めている。平均スコアを合計すると以下のようになる。GLM-4.5
グローバルモデルでは3位、国産モデル、オープンソースモデルの両カテゴリーで1位を獲得している。特に、コード修正能力は SWE-Bench
このような権威あるベンチマークでの優れた性能は、ソフトウェア開発への応用の可能性を示している。
APIコールの価格に関してはGLM-4.5
段階的価格設定モデルが使用される。インプット・トークンの数が 0 ~ 32k の範囲にあり、アウトプット・トークンの数が 0 ~ 0.2k の範囲にある場合、価格はインプットが 0.8 ドル/100 万トークン、アウトプットが 2 ドル/100 万トークンである。 Deepseek R1
歌で応える Kimi k2
などのモデルを見ることができる。
さらに、高速バージョンのモデルは、実世界のテストで最大100トークン/秒の生成速度を実証しており、これはリアルタイムのインタラクションを必要とするアプリケーション・シナリオにとって重要な利点である。
多次元コード能力実戦テスト
を検証する。 GLM-4.5
実際のアプリケーションにおけるコード生成能力とデザインの美しさについて、業界で有名な他の2つのモデル、ダークサイド・オブ・ムーン(Dark Side of Moon)と比較した。 Kimi K2
を発表した。 Qwen3 Coder
-サイド・バイ・サイドのレビューを繰り返した。
テスト1: モダンなログインページ生成
1つ目は、通常のウェブコンポーネントを生成するモデルの能力を評価することを目的とした、基本的なフロントエンド開発タスクである。
テスト・キュー・ワード
以下の機能を含む最新のログインページを作成してください:
- メールボックスとパスワード入力ボックス
- ログインボタン
- 「パスワードを記憶」と「パスワードを忘れた場合」オプション
- Googleサードパーティログイン
- 登録リンク
必要条件:ダークテーマ、未来的な技術スタイル、中央に配置されたレイアウト、優れたユーザーエクスペリエンス。
3つのモデルとも、基本的なインタラクション効果を備えた、完全に機能的なログインページの作成に成功している。それぞれ、デザインスタイルや、ログインページにおけるQwen3 Coder
配色はより目立つようになり GLM-4.5
歌で応える Kimi K2
高品質のリアライゼーションも提供される。
テスト2:アニメーション天気カード
2つ目のテストは、CSSアニメーションとJavaScriptの相互作用の複雑さを増し、複数の天気を動的に表示するアニメーション天気予報カードを作成するという課題であった。
テスト・キュー・ワード
CSSとJavaScriptを含む1つのHTMLファイルを作成し、アニメーション付きの天気予報カードを作成しなさい。 このカードは、以下の天気を明確なアニメーションで視覚的に表現する必要があります。このカードは、以下の天候をアニメーションで視覚的に表現しなければならない。
風:(雲の動き、木々の揺れ、風切り線など)
雨:(雨粒が落ちる、水たまりができるなど)
太陽:(例:輝く光線、明るい背景)
雪:(降る雪、積もる雪など)
すべてのウェザーカードを並べて見せる。
カードは暗い背景でなければならない。
HTML、CSS、JavaScriptのすべてのコードを、この1つのファイルに記述してください。 JavaScriptには、異なる気象条件を切り替える方法を含める必要があります。JavaScriptは、異なる気象条件を切り替える方法を含める必要があります。
そのテストではGLM-4.5
カードのパフォーマンスは格段に向上している。生成されたカードは滑らかにアニメーションするだけでなく、ユーザー・インターフェース(UI)の細部もより洗練され、全体的なデザインもより美しくなっている。
テスト3:ハイファッション雑誌のスタイル知識カード
さらに高度なデザインと審美眼でモデルの能力を評価するため、より専門的なプロンプトが導入され、モデルは一流の国際的デジタル雑誌のアートディレクターに扮し、未来的な技術にインスパイアされたナレッジカードをデザインすることになった。
テスト・キュー・ワード
ヴォーグ』や『エル』などのファッション誌でデジタルレイアウトのデザインを手がけ、高級雑誌の美学とモダンなウェブデザインを融合させ、魅力的なビジュアル体験を生み出すことを得意としています。
マンデート
フューチャリスティック・テックを使って、ハイファッション雑誌風のナレッジカードをデザインしてください。日々の情報を洗練されたラグジュアリーな雑誌のレイアウトで紹介し、ユーザーに高級雑誌をめくっているような視覚的な楽しみを与えます。
- 日付エリア:各スタイル独自の方法で現在の日付を表示
- 見出しと小見出し:スタイルに応じてフォント、サイズ、タイポグラフィを調整する
- 引用ブロック:スタイルの特徴を反映した独自の引用スタイルをデザインする。
- 核となる箇条書きリスト:スタイルに適した方法でリストの内容を提示する
- 編集部注/ヒント:サイドバーや注釈のスタイルに合わせてデザインする。
技術仕様:
* 使用HTML5、Font Awesome、Tailwind CSS和必要的JavaScript
* FontAwesome: [https://lf6-cdn-tos.bytecdntp.com/cdn/expire-100-M/font-awesome/6.0.0/css/all.min.css](https://lf6-cdn-tos.bytecdntp.com/cdn/expire-100-M/font-awesome/6.0.0/css/all.min.css)
* Tailwind CSS: <https://lf3-cdn-tos.bytecdntp.com/cdn/expire-1-M/tailwindcss/2.2.19/tailwind.min.css>
* 中文字体: [https://fonts.geekzu.org/css2?family=Noto+Serif+SC:wght@400;500;600;700&family=Noto+Sans+SC:wght@300;400;500;700&display=swap](https://fonts.geekzu.org/css2?family=Noto+Serif+SC:wght@400;500;600;700&family=Noto+Sans+SC:wght@300;400;500;700&display=swap)
- ページロード時のフェードイン効果やホバーフィードバックなど、微妙なキネティック効果の追加を検討する。
- パフォーマンスと保守性を重視し、コードがクリーンで効率的であることを保証する。
- CSS変数を使用して色と間隔を管理し、スタイルの一貫性を保つ
- リキッドデジタルモーフィズムスタイルでは、流体ダイナミックエフェクトとグラデーショントランジションを追加する必要がある。
- 超感覚的なミニマリスト・スタイルのためには、すべてのピクセルと微妙なインタラクティブ・フィードバックが正確に制御されていなければならない。
- 新表現主義的なデータ・ビジュアライゼーションのスタイルでは、データを視覚的にデザインに組み込むことが重要である。
出力要件:
- コードはエレガントでベストプラクティスに準拠し、CSSは細部にまで細心の注意を払うこと。
- 幅440px、高さ1,280px以下で設計されています。
- 主題を抽象化し、洗練させ、コラムのポイントや最も中心的な文章の引用のみを示し、読み応えのあるものにする。
- 常に中国語で出力されるが、装飾的な要素をフランス語や英語など他の言語で使用することで、印象的に見せることができる。
国際的な一流雑誌のアート・ディレクターのビジョンと美的基準で、ユーザーに「これはただの情報カードではなく、コレクション可能なデジタル・アートの一部だ」と感じてもらえるような、異なるスタイルでありながら同様に素晴らしいデジタル・マガジン・スタイルのカードを制作してください。
Kimi K2
とともに Qwen3 Coder
生成結果は以下の通りである:
この比較ではGLM-4.5
その利点はさらに明白になる。このカードが生み出すカードは、調和のとれた配色で光る背景によって未来感を効果的に際立たせるだけでなく、さらに重要なのは、デザインにインタラクティブな要素を取り入れた唯一のモデルであることだ。マウスがホバーすると、カードがそれに対応したフィードバックを返し、ユーザー体験を向上させる。
テスト4:3Dレンガゲーム
最終的なテストは、複雑なタスクである。 Three.js
ゲームロジック、物理エンジン、視覚効果の組み合わせを処理するモデルの能力を検証する、完全にマウスで操作する3Dレンガ割りゲームを作成します。
テスト・キュー・ワード
"マウスだけで操作する3Dレンガ崩しゲームを作ろう:
- Three.jsを使用して、以下のコア・コンポーネントを持つ没入型3Dシーンを構築します:左右にスライドするプレイヤー・パドル:マウスの水平移動でコントロール;物理的特性を持つバウンド球体:適度な初速、衝突後の反射の法則に従う;色の異なるホバリング・レンガの列:異なる色は異なる得点に対応します。
- 物理的効果の要件: 衝突検出: レンガ/バッフル/境界線と球体の正確な衝突; 動的反発: バッフルの異なる位置での衝突は、ボールの水平方向の反発角度を変える; 重力のシミュレーション: 球体の軌道は自然放物線の形である。
- ゲームメカニクス: スコアシステム: レンガを壊すとリアルタイムで得点(通常のレンガ=10点、黄金のレンガ=50点); ライフバリュー: 初期3ライフ、ボールが底に落ちるとライフが減算される; スピード進化: レンガを10個壊すごとに、ボールのスピードが15%増加する。
- 視覚効果:レンガが壊れるとパーティクルが爆発するエフェクト、球体の軌跡に追加されたダイナミックなトレーリング・ライト・エフェクト、バッフルが衝突すると現れる円形の衝撃波アニメーション。
- インタラクションの強化: スコアとライフ値のリアルタイムHUD表示; 最終スコアを表示するゲームオーバー画面とリスタートボタン; 衝突効果音の追加 (Web Audio APIを使用)"
最終的な実現に向けてGLM-4.5
生成されたゲームは最もプレイしやすく、ゲーム・ロジックの完成度が最も高く、バグの発生が最も少なかったため、複雑なコード生成タスクを処理する優れた能力が改めて証明された。
一緒に考えてみよう。GLM-4.5
特にデザインの美しさと複雑なインタラクションを組み合わせたタスクにおいて、コード生成の強みを発揮している。コード生成における1回限りの成功率と、細部を制御する能力により、開発者の注目に値する高性能なオープンソースモデルとなっている。