MegaTTS3で生成された音声のアクセントの強さを調整するには？

2025-08-27

1.8 K

直接リンクモバイルビュー

MegaTTS3は、2つの重要なパラメータによって、きめ細かなアクセントコントロールを実現します：

コア・パラメータの説明

p_w（発音ウェイト）::
発音の標準化をコントロールし、値が小さい（1.0に近い）ほど元のアクセントをより多く残し、値が大きい（2.5など）ほど標準化された発音になる傾向がある。
t_w（トーンウェイト）::
音色の類似性をコントロールし、通常はp_wより0～3単位高く設定する。

方言の保存や特定のシナリオのニーズに適している：
--p_w 1.0 --t_w 3.0

教育や放送の場面に適している：
--p_w 2.5 --t_w 2.5