使用 SongGeneration 时需注意以下几点:
- 输入提示:避免同时提供
prompt_audio_path
和descriptions
,否则可能因冲突导致生成质量下降。 - 歌词格式:歌词需按结构分段(如
[verse]
、[chorus]
),非歌词段(如[intro-short]
)不应包含歌词。 - 参考音频:建议使用歌曲副歌部分(10 秒以内),以获得最佳音乐性。
- 硬件要求:基础模型需要 10GB GPU 内存,带参考音频需 16GB。
本答案来源于文章《SongGeneration:生成高品质音乐和歌词的开源AI模型》