Anleitung zur Verwendung der Funktion zum Klonen von Stimmen
Das Klonen von Stimmen ist eine besondere Funktion von Wavel AI, und der Prozess kann in drei Hauptschritte unterteilt werden:
- Phase der ProbenvorbereitungSie müssen 1-2 Minuten qualitativ hochwertiger Stimmproben (empfohlenes WAV-Format) mit klarer Aussprache und Hintergrundgeräuschen unter 30 Dezibel hochladen. Es wird empfohlen, Passagen mit gleichmäßiger Intonation zu wählen und Störungen wie Husten oder Atemgeräusche zu vermeiden.
- Phase der ModellschulungDas System analysiert die Stimmcharakteristika der Probe durch ein tiefes neuronales Netzwerk, und es dauert in der Regel 5-10 Minuten, bis die akustische Modellierung abgeschlossen ist. Zu diesem Zeitpunkt können Sie den Namen der Stimme festlegen (z. B. "Stimme des Markensprechers") und die entsprechende Sprachszene auswählen.
- AnwendungstestphaseSobald das Training abgeschlossen ist, kann die geklonte Sprache durch Eingabe eines beliebigen Textes erzeugt werden. Es wird empfohlen, zunächst eine 30-sekündige Testlesung durchzuführen, um den Effekt durch Anpassung der Tonhöhe (±20%) und der Sprechgeschwindigkeit (0,8-1,2 Mal) zu optimieren
WICHTIGER HINWEIS: Diese Funktion unterliegt einer Nutzungsrichtlinie, die das Klonen von nicht autorisierten Sounds von Dritten verhindert. Die kommerzielle Nutzung erfordert, dass Sie die Lizenzdatei für die Aufnahme des Original-Samples aufbewahren. Technisch gesehen ist die Unterstützung für Chinesisch und Englisch derzeit am vollständigsten, für kleinere Sprachen muss das Sample möglicherweise auf 3 Minuten erweitert werden.
Diese Antwort stammt aus dem ArtikelWavel AI: Ein Tool für die schnelle Erstellung mehrsprachiger Videosynchronisation und UntertitelungDie