Sistema de verificação de desempenho e cobertura de idioma
O suporte a idiomas do Voxtral é dividido em dois níveis: idiomas do Core Advantage e idiomas estendidos:
- Primeira camada de idiomas europeus(francês/inglês/alemão/espanhol, etc.) WER (taxa de erro de palavras) < 8% no benchmarking FLEURS, alcançando precisão de nível comercial
- Idioma dos mercados emergentes(Hindi/português, etc.) Validado com o conjunto de dados do Mozilla Common Voice, excelente desempenho em cenários de conversação
Sua validação de proficiência multilíngue usa um mecanismo triplo:
- Teste de conjunto de dados padronizado (com variantes de pronúncia e amostras de sotaque)
- Avaliação da aprendizagem migratória entre idiomas (validação da capacidade de generalização do modelo para idiomas com poucos recursos)
- Teste de estresse em cenário real (por exemplo, entrada mista multilíngue em um ambiente ruidoso)
É importante observar que o modelo tem uma vantagem nativa no processamento do idioma francês, suportando uma ampla gama de variantes dialetais, incluindo o francês de Quebec.
Essa resposta foi extraída do artigoVoxtral: um modelo de IA desenvolvido pela Mistral AI para transcrição e compreensão de falaO































