需求背景
专业音乐制作常需要单独处理人声和伴奏轨道。SongGen的双轨模式专为此场景设计。
具体操作步骤
- 选择SongGenDualTrackForConditionalGeneration模型类进行初始化
- 生成后会获得独立的vocal_sequences和acc_sequences音频数组
- 使用soundfile分别保存:
sf.write('vocal.wav', vocal_array, sr)
sf.write('accompaniment.wav', acc_array, sr)
进阶应用
- 可对人声进行降噪/变调处理
- 可对伴奏进行响度均衡或分段编辑
- 最终使用DAW软件混合导出
本答案来源于文章《SongGen:自动生成歌曲的单阶段自回归Transformer》