Im Vergleich zum Vorgängermodell Speech 02 hat MiniMax mit der neuen Generation des Spracherzeugungsmodells Speech 2.5 einen Durchbruch bei drei Kernmetriken erzielt: mehrsprachige Ausdruckskraft, Genauigkeit der Klangfarbenwiedergabe und Sprachabdeckung. Das Modell optimiert nicht nur die Generierung von Mainstream-Sprachen wie Mandarin-Chinesisch und Englisch und verbessert den Grad der Sprachähnlichkeit und des natürlichen Rhythmus, sondern verbessert auch die Fähigkeit der sprachübergreifenden Timbre-Reproduktion, die in der Lage ist, die Details der Stimme des Sprechers, einschließlich spezifischer Akzente und der Sprachintonation, genau zu erfassen und zu erhalten. Darüber hinaus unterstützt Speech 2.5 nun auch Nischensprachen wie Bulgarisch und Dänisch, wodurch sich die Gesamtzahl der unterstützten Sprachen auf 40 erhöht, was für die Bereitstellung mehrsprachiger Inhalte in globalen Unternehmen von großem Nutzen ist.
Diese Antwort stammt aus dem ArtikelMiniMax veröffentlicht Speech 2.5: Sprachsynthesetechnologie bringt Durchbruch bei Mehrsprachigkeit und TonwiedergabeDie