As principais atualizações do MiniMax Speech 2.5 estão em três áreas principais:
- Multilinguismo aprimoradoOtimizou a geração do chinês mandarim e melhorou o desempenho do inglês e de outros idiomas convencionais, resolveu o problema do "sentido mecânico" em cenários multilíngues e melhorou o grau de similaridade e os ritmos naturais.
- Maior precisão na reprodução de tonsCapacidade aprimorada de capturar detalhes vocais, especialmente em cenários complexos, como reprodução entre idiomas e preservação de sotaques específicos (por exemplo, sotaques regionais), permitindo uma reprodução de maior fidelidade. Por exemplo, é possível imitar sotaques específicos da fala e manter as qualidades vocais do falante original ao trocar de idioma.
- Cobertura ampliada de idiomasSuporte a idiomas de nicho, como búlgaro, dinamarquês e hebraico, foi adicionado, elevando o número total de idiomas para 40, oferecendo mais possibilidades de implementação de conteúdo globalizado.
Essa resposta foi extraída do artigoA MiniMax lança o Speech 2.5: a tecnologia de síntese de fala é inovadora em multilinguismo e reprodução de tonsO