SongGen提供了多项强大的音乐生成功能,主要包括:
- 文本到歌曲生成:核心功能,支持通过输入歌词和音乐描述文本直接生成完整歌曲
- 细粒度音乐控制:支持调节多种音乐属性,包括:
- 歌词内容
- 乐器选择和组合
- 音乐风格(流行、摇滚、古典等)
- 情绪表达(欢快、悲伤、激昂等)
- 音色特点
- 声音克隆:可通过3秒的参考音频片段模仿特定声音特征
- 双输出模式:
- 混合模式 – 直接输出合并的人声和伴奏音轨
- 双轨模式 – 分离输出人声和伴奏音轨,便于后期制作
- 数据处理工具:提供完整的自动化数据预处理管道和质量控制机制
这些功能使SongGen不仅是一个音乐生成工具,更是一个完整的音乐创作生态系统,从初始构思到最终成品都能提供支持。特别是声音克隆和双轨输出功能,为专业音乐制作和个性化需求提供了更多可能性。
本答案来源于文章《SongGen:自动生成歌曲的单阶段自回归Transformer》