Em comparação com seu antecessor, o Speech 02, a nova geração do modelo de geração de fala Speech 2.5 da MiniMax, fez avanços em três métricas principais: expressividade multilíngue, precisão de reprodução de timbre e cobertura de idiomas. O modelo não só otimiza a geração dos principais idiomas, como o mandarim e o inglês, e melhora significativamente o grau de semelhança da fala e o ritmo natural, como também aprimora a capacidade de reprodução de timbre em vários idiomas, capaz de capturar e preservar com precisão os detalhes da voz do locutor, incluindo sotaques específicos e entonação da fala. Além disso, o Speech 2.5 adiciona suporte a idiomas de nicho, como o búlgaro e o dinamarquês, elevando o número total de idiomas suportados para 40, o que é valioso para a implementação de conteúdo multilíngue em empresas globais.
Essa resposta foi extraída do artigoA MiniMax lança o Speech 2.5: a tecnologia de síntese de fala é inovadora em multilinguismo e reprodução de tonsO