Um das Problem zu lösen, dass der Gesang nicht mit dem Backing-Track übereinstimmt, können Sie ihn mit den folgenden Schritten optimieren:
- Verwendung der Multitrack-Ausgabefunktion: Fügen Sie im Befehl generate
--separate_tracksParameter, die getrennte Gesangs- und Hintergrundspuren für einfache Balanceanpassungen bei der Nachbearbeitung erzeugen - Precision Control Style Beschreibung: In der JSONL-Datei sicherstellen, dass
descriptionsFeld enthält eine Beschreibung des passenden Rhythmus (z. B.the bpm is 125) und Instrumentenkombinationen - Prüfen Sie die Segmentierung des Textes: Streng nach den
[verse]/[chorus]usw. strukturierte Texte, nicht lyrische Passagen (z. B.[intro-short]) sollte keinen textlichen Inhalt enthalten - Referenz-Audio-OptimierungHochladen eines 10-sekündigen Referenzclips mit vollem Gesang und Hintergrundgesang (Refrain wird empfohlen), das Modell wird die beiden besser harmonisieren!
Diese Antwort stammt aus dem ArtikelSongGeneration: ein quelloffenes KI-Modell zur Erzeugung hochwertiger Musik und LiedtexteDie































