言語横断的音声合成のための移行スキーム
Muyan-TTSは現在、主に英語をサポートしていますが、以下の方法で中国語の出力も可能です:
- 間接的なプログラム生成:
- 機械翻訳で中国語テキストを英語に変換する
- Muyan-TTSによる英語音声の生成
- 音声変換(例:so-vits-svc)による音色の変換
- モデルの微調整プログラム:
- 中英パラレルコーパス(同一内容の対訳録音)の収集
- 既存モデルに基づく言語間適応トレーニング
- SoVITSデコーダーの中国語音素処理能力のチューニングに注力
- ハイブリッド・システム・プログラム:
- Muyan-TTSによる英語パッセージの処理
- 他の中国語TTSシステム(例:VITS)とインターフェイスし、番組の中国語部分を処理する。
- トーンパラメーターをポストで調整する
これらのプログラムでは、韻の自然さが損なわれる可能性があることに留意すべきである。プロ級の中国語コンテンツについては、公式サポートを待つか、コミュニティベースの多言語トレーニングプログラムに参加することをお勧めする。現在では、Adobe Auditionなどのツールを使って、生成後に微調整を行い、聴き心地を改善することができます。
この答えは記事から得たものである。Muyan-TTS:パーソナライズされたポッドキャストの音声トレーニングと合成について































