使用 SongGeneration 时需注意以下几点:
- 输入提示:避免同时提供
prompt_audio_path和descriptions,否则可能因冲突导致生成质量下降。 - 歌词格式:歌词需按结构分段(如
[verse]、[chorus]),非歌词段(如[intro-short])不应包含歌词。 - 参考音频:建议使用歌曲副歌部分(10 秒以内),以获得最佳音乐性。
- 硬件要求:基础模型需要 10GB GPU 内存,带参考音频需 16GB。
本答案来源于文章《SongGeneration:生成高品质音乐和歌词的开源AI模型》

































