Das Text-to-Speech-System von Guidde nutzt die Deep Neural Network-Technologie, um die Sprachsynthese in 112 Sprachen und 230 Dialekten zu unterstützen. In multinationalen Unternehmensszenarien ermöglicht diese Funktion die Generierung von Schulungsvideos in verschiedenen Sprachversionen mit nur einem Klick. So nutzt das Microsoft Asia Team Guidde, um gleichzeitig Office-Bedienungsanleitungen in Chinesisch, Englisch, Japanisch und Koreanisch zu erstellen. Das System ist speziell für die korrekte Aussprache von Fachterminologie optimiert und erreicht bei Tests in den Bereichen IT, Medizin und anderen Berufsfeldern eine Aussprachereichweite von 98%. Die Benutzer können die Sprechpausen durch das Setzen von Satzzeichen steuern und die Sprechgeschwindigkeit von 80-160 Wörtern/Minute einstellen. Typische Fälle zeigen, dass die globale Schulungsabteilung von Unilever die Kosten für die mehrsprachige Videoproduktion um 67% gesenkt hat, nachdem sie diese Funktion eingeführt hatte.
Diese Antwort stammt aus dem ArtikelLeitfaden: Schnelles Erstellen von KI-gesteuerten Videoanleitungen und DokumentationenDie
































