Bonsai言語モデルで使用されている三項重み(ternary weights)は、従来のニューラルネットワークにおける32ビットまたは16ビットの浮動小数点ウェイトパラメータを、わずか3つの数値状態(例:-1、0、+1)にスリム化することを中心とした革新的なモデル圧縮技術である。この技法は、以下のメカニズムによって高性能を実現する:
- ストレージの最適化各重量に必要な記憶領域はわずか2ビットであり、その結果、5億パラメータ・モデルのサイズを大幅に縮小することができる。
- コンピューティング・アクセラレーション3値演算は複雑な乗算を累積演算に変換するため、CPUなどのエッジデバイスで大幅な高速化を実現します。
- 精密保持学習時には勾配補正アルゴリズムが使用され、推論段階では16ビット精度で実行される。
特にARCやMMLUのようなベンチマークでは、その性能は従来の浮動小数点モデルをも凌駕しています。
この答えは記事から得たものである。Bonsai: エッジデバイスでの操作に適した3値重み付き言語モデルについて




























