KittenTTS bietet grundlegende Anpassungsmöglichkeiten des Klangstils:
- Auswahl der voreingestellten Stimme: durch
voice
Parameter (z.B.male_clear
) Umschalten zwischen voreingestellten Stimmen für verschiedene Geschlechter und Töne, siehe offizielle Dokumentation für Optionen. - Kontrolle der ZeichensetzungObwohl eine direkte Anpassung des Parameters Tonhöhe/Sprachgeschwindigkeit nicht unterstützt wird, können Sprachrhythmus und Pausen indirekt durch Interpunktion im Text (z.B. Kommas, Ausrufezeichen) beeinflusst werden.
Beachten Sie, dass KittenTTS im Vergleich zu professionellen TTS-Modellen (z. B. XTTS-v2) über eine einfachere Sprachsteuerungsfunktionalität verfügt, deren Hauptvorteile das geringe Gewicht und die Betriebseffizienz sind.
Diese Antwort stammt aus dem ArtikelKittenTTS: Ein leichtgewichtiges Text-to-Speech-ModellDie