各モデルの技術的特徴の比較
ヴォクストラルの革新性は、その入念なバージョンアップに反映されている:
- 24Bパラメータ・バージョンは、クラウド・コンピューティング環境に最適化されており、処理能力は最大:
- 30分の音声トランスクリプションに対応
- 40分間の深い理解課題
- 32kトークン・コンテキスト・ウィンドウ
- 3Bミニバージョンはエッジデバイス向けである:
- 85%のコア機能の維持
- GPUは中程度の構成で動作する。
- 特にIoTとモバイルシナリオに適している
このアーキテクチャ設計により、Voxtralは現在、クラウドベースのSaaSサービスとプライベートな導入の両方をサポートする唯一のオープンソース・スピーチ・モデルとなっている。
この答えは記事から得たものである。Voxtral:ミストラルAIが開発した音声転写・理解用AIモデルについて































