Hintergrund
Einer der häufigsten Probleme bei der Musikgenerierung ist die Generierung von Inhalten in einem einzigen oder unkontrollierbaren Stil, den SongGen durch einen feinkörnigen Kontrollmechanismus effektiv löst.
Zentrale Lösungen
- Mehrdimensionale Eigenschaftsbeschreibung: Eingabetext, der auch Folgendes enthältKlang(z. B. Pop/Rock),Seelenzustand(z. B. fröhlich/melancholisch),Instrument Beschreibung(z. B. Klavier + E-Gitarre) und andere Bezeichnungen
- Strukturierte EingabemaskenEin standardisiertes Format von "Stil: [Wert], Stimmung: [Wert], Instrument: [Wert]" wird empfohlen.
- Referenz Audio AssistHochladen von 3-sekündigen Audioclips ähnlicher Stile, um das Verständnis des Modells für den Zielstil zu verbessern
Betriebsvorschlag
Beispiel für Eingabetext:
"Stil: Folk-Rock, Stimmung: nostalgisch und warm, Instrumentierung: Akustikgitarren-Lead + Mundharmonika-Intermezzo"
Funktioniert besser mit Referenz-Audio.
Diese Antwort stammt aus dem ArtikelSongGen: Ein einstufiger autoregressiver Transformator für die automatische SonggenerierungDie































