MiniMaxの新世代音声生成モデルSpeech 2.5は、前モデルのSpeech 02と比較して、多言語表現力、音色再現精度、言語カバー率という3つのコア指標において飛躍的な進歩を遂げました。このモデルは、北京語や英語などの主流言語の生成を最適化し、音声の類似度や自然なリズムを大幅に向上させるだけでなく、特定のアクセントや話し方のイントネーションなど、話者の声の細部を正確に捉え、保持することができる、言語横断的な音色再現能力も強化しています。さらに、Speech 2.5では、ブルガリア語やデンマーク語などのニッチ言語のサポートが追加され、サポートされる言語の総数は40言語となり、グローバル企業における多言語コンテンツの展開に重宝されます。
この答えは記事から得たものである。MiniMax、Speech 2.5をリリース:音声合成技術が多言語対応と音色の再現を突破について