SongGen的安装过程相对直接,但需要准备适当的硬件和软件环境:
基础环境要求
- 支持CUDA的NVIDIA GPU(推荐)或CPU模式
- Python 3.9+环境
- conda包管理器
安装步骤
- 克隆项目仓库:
git clone https://github.com/LiuZH-19/SongGen.git cd SongGen
- 创建conda环境:
conda create -n songgen python=3.9.18 conda activate songgen
- 安装PyTorch和CUDA(推荐CUDA 11.8):
conda install pytorch torchvision torchaudio cudatoolkit=11.8 -c pytorch -c nvidia
- 安装SongGen核心包(推理模式下):
pip install .
- 下载预训练模型检查点:需要下载xcodec和songgen的预训练权重
安装完成后,开发者可以根据需要使用混合模式(SongGenMixedForConditionalGeneration)或双轨模式(SongGenDualTrackForConditionalGeneration)进行音乐生成。
对于没有CUDA设备的用户,可以移除CUDA相关安装步骤并使用CPU模式运行,但生成速度会明显降低。
本答案来源于文章《SongGen:自动生成歌曲的单阶段自回归Transformer》