言語カバレッジとパフォーマンス検証システム
Voxtralの言語サポートは、コア・アドバンテージ言語と拡張言語の2つの層に分かれています:
- ヨーロッパ言語の第一層(フランス語/英語/ドイツ語/スペイン語など) FLEURSベンチマークにおけるWER (Word Error Rate) < 8%、商用レベルの精度を達成。
- 新興市場言語(ヒンディー語/ポルトガル語など) Mozilla Common Voiceデータセットで検証、会話シナリオで優れたパフォーマンス
その多言語熟達度検証は、三重のメカニズムを使っている:
- 標準化データセットテスト(発音バリエーションとアクセントサンプルを含む)
- 言語横断的な移動学習評価(低リソース言語へのモデルの一般化能力の検証)
- 実シナリオストレステスト(ノイズの多い環境での多言語混在入力など)
特筆すべきは、このモデルがフランス語処理においてネイティブの優位性を持ち、ケベック・フランス語を含む幅広い方言のバリエーションをサポートしていることだ。
この答えは記事から得たものである。Voxtral:ミストラルAIが開発した音声転写・理解用AIモデルについて