Die folgenden Punkte sollten bei der Verwendung von SongGeneration beachtet werden:
- Eingabeaufforderung: Vermeiden Sie die gleichzeitige Bereitstellung von
prompt_audio_path
im Gesang antwortendescriptions
Andernfalls kann die Qualität der Erzeugung aufgrund von Konflikten beeinträchtigt werden. - TextformatDer Text muss in Abschnitte gegliedert sein (z.B.
[verse]
und[chorus]
), nicht-lyrische Segmente (wie z. B.[intro-short]
) sollte keinen Text enthalten. - Referenz AudioEs wird empfohlen, den Refrain des Liedes (10 Sekunden oder weniger) zu verwenden, um eine optimale Musikalität zu erreichen.
- Hardware-Voraussetzung: 10 GB GPU-Speicher für das Basismodell und 16 GB mit Referenz-Audio.
Diese Antwort stammt aus dem ArtikelSongGeneration: ein quelloffenes KI-Modell zur Erzeugung hochwertiger Musik und LiedtexteDie