Hinweis zur Verwendung von KittenTTS: 1) Erfordert Python 3.6+ als Laufzeitumgebung; 2) Die erstmalige Verwendung erfordert eine Internetverbindung, um ca. 25 MB an Modellgewichten herunterzuladen (spätere Offline-Laufzeit ist möglich); 3) Derzeit liegt der Schwerpunkt auf der Optimierung der englischen Spracherzeugung, wobei andere Sprachen nur begrenzt unterstützt werden; 4) Sprachstilanpassungen müssen über die Voreinstellungen vorgenommen werdenvoiceund 5) obwohl Interpunktion zur Beeinflussung des Sprachrhythmus unterstützt wird, ist eine feinkörnige Intonationskontrolle nicht vorgesehen. Es wird empfohlen, diese Einschränkungen auf der Grundlage spezifischer Anforderungsszenarien zu bewerten.
Diese Antwort stammt aus dem ArtikelKittenTTS: Ein leichtgewichtiges Text-to-Speech-ModellDie































