対訳ハイブリッド合成の品質管理手法
中国語と英語の混在した会話で自然な流暢さを確保するための主な対策:
- テキストの前処理:
- 中国語と英語の間にスペースを入れる("试试"→"测试试")
- 長い複合語にはハイフンを使う("COVID19″ではなく、"COVID-19″)。
- オーディオ選択」を参照:
- バイリンガルのサンプルを使用(英語版50%、中国語版50%)
- ネイティブ・スピーカーを好むバイリンガル
- パラメータの組み合わせの最適化:
- セットアップ
--p_w=1.5バランスの取れたアクセント機能 - スケールアップ
--t_w3.5強化された音色の連続性へ
- セットアップ
- 校正後:
- Alignerサブモジュールによる音素境界のチェック
- WaveVAEによる問題断片の再合成
専門分野のコンテンツについては、事前に発音辞書を作成することをお勧めします。持続性の問題が発生した場合は、分節合成の後にスプライシングを試みる。
この答えは記事から得たものである。MegaTTS3:中国語音声と英語音声を合成する軽量モデルについて































