Ein Übergangsschema für die sprachenübergreifende Sprachsynthese
Obwohl Muyan-TTS derzeit hauptsächlich Englisch unterstützt, kann mit den folgenden Methoden eine akzeptable chinesische Ausgabe erzielt werden:
- Indirekte Programmerstellung:
- Konvertierung von chinesischem Text ins Englische mit maschineller Übersetzung
- Generierung englischer Sprache mit Muyan-TTS
- Umwandlung von Tönen über Sprachumwandlung (z. B. so-vits-svc)
- Programm zur Feinabstimmung des Modells:
- Sammlung paralleler chinesisch-englischer Korpusse (zweisprachige Aufnahmen desselben Inhalts)
- Sprachübergreifendes Anpassungstraining auf der Grundlage bestehender Modelle
- Schwerpunkt auf der Optimierung der Fähigkeit des SoVITS-Decoders zur Verarbeitung chinesischer Phoneme
- Programm für Hybridsysteme:
- Verarbeitung englischer Passagen mit Muyan-TTS
- Schnittstelle zu anderen chinesischen TTS-Systemen (z. B. VITS) zur Bearbeitung des chinesischen Teils des Programms
- Einstellen der Tonparameter in der Nachbearbeitung
Es ist zu beachten, dass diese Programme die Natürlichkeit der Reime beeinträchtigen können. Für professionelle chinesische Inhalte ist es empfehlenswert, auf offizielle Unterstützung zu warten oder an einem mehrsprachigen Schulungsprogramm der Gemeinschaft teilzunehmen. Derzeit können kleinere Anpassungen nach der Generierung vorgenommen werden, um das Hörerlebnis mit Tools wie Adobe Audition zu verbessern.
Diese Antwort stammt aus dem ArtikelMuyan-TTS: Personalisiertes Podcast-Sprachtraining und -syntheseDie































