KittenTTSは、基本的なサウンドスタイルのカスタマイズを提供します:
- プリセット音色選択スルー
voice
パラメーター(例male_clear
オプションについては公式ドキュメントを参照してください。 - 句読点コントロールスピーチのピッチ/スピード・パラメーターの直接的な調整はサポートされていませんが、スピーチのリズムや間合いは、テキスト中の句読点(カンマや感嘆符など)によって間接的に影響を受けることがあります。
プロ仕様のTTSモデル(XTTS-v2など)と比べると、KittenTTSはより基本的な音声コントロール機能を備えており、主な利点は軽量で操作効率が高いことです。
この答えは記事から得たものである。KittenTTS: 軽量音声合成モデルについて