中国語TTSスペシャル・チャレンジ
中国語には、多声文字や小児音など、複雑な発音規則があります。現バージョンの中国語サポートはまだ改良中ですが、精度を向上させるために以下のソリューションを使用することができます:
処方
- テキスト前処理統合
pypinyin多声文字のライブラリ必須ラベリング(例:'銀行'→yin hang) - 韻律SSMLタグを挿入して、入力テキストの一時停止を制御する (
<break time="200ms"/>) - 民営化トレーニングオープンソース・ツールキットの利用
chinese-tts-finetuneONNXモデルの微調整 - 後処理補正スルー
FFmpegなatempoフィルター調整 異常音声レートクリップ
中間代替プログラム
緊急に中国語のTTSが必要な場合は、1)正式なv1.0中国語モデルを待つ 2)併用することをお勧めします。Bert-VITS2フロントエンドのテキスト分析の実行 3) フォールバックのためのAliCloud/Xunfei APIとのインターフェース
この答えは記事から得たものである。ココロ-ONNX:多言語・多音声をサポートする効率的な音声合成ツールについて































