海外からのアクセス:www.kdjingpai.com
Ctrl + D このサイトをブックマークする
現在の場所図頭 " AIアンサー

ハイブリッド・エキスパート・アーキテクチャがGLM-4.5の資源効率に大きな優位性をもたらす

2025-08-20 703

MoEアーキテクチャがもたらした技術的ブレークスルー

GLM-4.5が採用したMixture of Expertsアーキテクチャは、その中核となる技術革新である。このアーキテクチャは、全パラメータの代わりに320億個のパラメータ(GLMAirは120億個)を動的に活性化することで、従来の密なモデルと比較して60-70%の計算量を削減する。実装面では、モデルには複数の専門家サブネットワークが含まれ、各入力トークンは処理のために最も関連性の高い2〜4人の専門家にルーティングされる。 この選択的活性化メカニズムにより、モデル容量を維持しながら推論効率を劇的に向上させる。

実際の導入テストによると、GLM-4.5-Airバージョンは16GBのGPUメモリ(INT4量子化後は12GB)のみで動作し、同容量の高密度モデルと比較して40%のビデオメモリを節約できる。長いテキスト処理のシナリオでは、独自のコンテキスト・キャッシング・テクノロジーにより、重複計算が30%削減されます。これらの機能により、RTX3090のようなコンシューマー向けGPUで動作する初の1000億パラメータレベルのマルチモーダルモデルとなり、企業展開の敷居を大幅に下げることができます。

おすすめ

AIツールが見つからない?こちらをお試しください!

キーワードを入力する アクセシビリティこのサイトのAIツールセクションは、このサイトにあるすべてのAIツールを素早く簡単に見つける方法です。

トップに戻る


Fatal error: Uncaught wfWAFStorageFileException: Unable to save temporary file for atomic writing. in /www/wwwroot/www.kdjingpai.com/wp-content/plugins/wordfence/vendor/wordfence/wf-waf/src/lib/storage/file.php:34 Stack trace: #0 /www/wwwroot/www.kdjingpai.com/wp-content/plugins/wordfence/vendor/wordfence/wf-waf/src/lib/storage/file.php(658): wfWAFStorageFile::atomicFilePutContents() #1 [internal function]: wfWAFStorageFile->saveConfig() #2 {main} thrown in /www/wwwroot/www.kdjingpai.com/wp-content/plugins/wordfence/vendor/wordfence/wf-waf/src/lib/storage/file.php on line 34