Qualitätskontrollmethoden für zweisprachige hybride Synthese
Wichtige Maßnahmen zur Gewährleistung eines natürlichen Sprachflusses bei gemischter chinesischer und englischer Sprache:
- Vorverarbeitung von Text:
- Leerzeichen zwischen Chinesisch und Englisch hinzufügen ("test test" → "测试 test")
- Verwenden Sie Bindestriche für lange zusammengesetzte Wörter ("COVID-19″ statt "COVID19″)
- Siehe Audioauswahl:
- Verwendung von Proben mit zweisprachigem Inhalt (501 TP3T auf Englisch und 501 TP3T auf Chinesisch)
- Vorliebe für zweisprachige Sprecher der Muttersprache des Sprechers
- Optimierung der Parameterkombinationen:
- aufstellen
--p_w=1.5Ausgewogene Akzentuierungen - aufstocken
--t_wZu 3.5 Verbesserte Tonkontinuität
- aufstellen
- Post-Kalibrierung:
- Überprüfung der Phonemgrenzen mit dem Submodul Aligner
- Resynthese von Problemfragmenten über WaveVAE
Für Inhalte in Fachgebieten empfiehlt es sich, im Voraus Aussprachewörterbücher zu erstellen. Bei Persistenzproblemen versuchen Sie es mit einer segmentalen Synthese, gefolgt von einer Spleißung.
Diese Antwort stammt aus dem ArtikelMegaTTS3: Ein leichtgewichtiges Modell zur Synthese von chinesischer und englischer SpracheDie































