ミニマックス・スピーチ2.5の主なアップグレードは次の3つです:
- 多言語主義の強化標準中国語の生成を最適化し、英語やその他の主流言語のパフォーマンスを向上させ、多言語シナリオにおける「機械的センス」の問題を解決し、類似度や自然なリズムを改善した。
- 音色の再現精度の向上特に、言語横断的な再生や特定のアクセント(地域的なアクセントなど)の保持といった複雑なシナリオにおいて、ボーカルの詳細を捉える能力が強化され、より忠実な再生が可能になります。例えば、特定のアクセントを模倣し、言語を切り替えても元の話者の声質を保持することが可能です。
- 対象言語の拡大ブルガリア語、デンマーク語、ヘブライ語などのニッチ言語のサポートが追加され、合計40言語となり、グローバル化されたコンテンツ展開の可能性が広がりました。
この答えは記事から得たものである。MiniMax、Speech 2.5をリリース:音声合成技術が多言語対応と音色の再現を突破について