Requirements background
专业音乐制作常需要单独处理人声和伴奏轨道。SongGen的双轨模式专为此场景设计。
Specific steps
- optionSongGenDualTrackForConditionalGeneration模型类进行初始化
- 生成后会获得独立的vocal_sequencescap (a poem)acc_sequences音频数组
- 使用soundfile分别保存:
sf.write('vocal.wav', vocal_array, sr)
sf.write('accompaniment.wav', acc_array, sr)
进阶应用
- 可对人声进行降噪/变调处理
- 可对伴奏进行响度均衡或分段编辑
- 最终使用DAW软件混合导出
This answer comes from the articleSongGen: A Single-Stage Autoregressive Transformer for Automatic Song GenerationThe