Bonsaiは、軽量言語モデルにおける3つの主要な差別化要因を明らかにした:
テクニカル・アーキテクチャの利点
- 3値圧縮比同じパラメータサイズのモデルの1/5~1/8のサイズ。
- ラマとミストラルのハイブリッド・アーキテクチャLlamaの構造的安定性とMistral分類器の効率の融合
パフォーマンス
公式ベンチマークでは:
- MobiLlama 0.5B(44.25)、Qwen 0.5B(45.61)を上回り、平均スコアは46.96。
- ARC-c(33.36)やPiQA(70.24)などの常識的な推論タスクが傑出していた。
アプリケーションの特徴
- エッジの互換性Raspberry Pi 4Bで最大18トークン/秒の推論を実現
- データ効率5BトークンのトレーニングデータでSOTAレベル
- オープンソース・フレンドリーモデル圧縮のための完全なトレーニングコードを提供し、二次開発をサポートする。
これらの特徴により、組み込み用に利用可能なオープンソースの言語モデルとしては最高のもののひとつとなっている。
この答えは記事から得たものである。Bonsai: エッジデバイスでの操作に適した3値重み付き言語モデルについて































