Vorbereitung der Umwelt
- Hardware-VoraussetzungComputer mit NVIDIA GPUs (empfohlener Grafikspeicher ≥ 16 GB)
- Software-BasisPython ≥ 3.8 + CUDA 11.8 Umgebung
- Abhängige Installation::
pip install -r requirements.txt+ FlashAttention 2 Optimierungspaket
Arbeitsablauf
- Vorbereitung des LiedtextesSpeichern von reinen Texttexten als UTF-8 kodierte .txt-Datei (es wird empfohlen, dass jede Zeile einer musikalischen Phrase entspricht)
- Basic Generation Befehl::
python generate_song.py --lyrics lyrics.txt --output song.wav - Erweiterte ParameteranpassungErhältlich über
--styleGeben Sie den Musikstil (Pop/Metal usw.) mit der Taste--vocalVokaltyp auswählen
Praktische Ratschläge
Für chinesische Benutzer wird empfohlen, die Liedtextdatei in das Verzeichnisphonetische Transkriptionum die Natürlichkeit der Melodie zu verbessern; die Generierung kann zunächst mit einem kurzen 30-Sekunden-Clip getestet werden (fügen Sie die--duration 30Parameter), bevor die Vollversion erstellt wird.
Diese Antwort stammt aus dem ArtikelYuE: Wandelt Liedtexte in ein Basismodell eines kompletten Songs um und unterstützt eine breite Palette von MusikstilenDie































