本地安装CSM Voice Cloning需要满足特定硬件和软件环境,以下是详细步骤:
前置要求:
- 硬件:NVIDIA CUDA兼容显卡(需足够显存)
- 软件:Python 3.10+版本
- 网络:能稳定下载模型及依赖项
安装流程:
- 克隆代码仓库:
git clone https://github.com/isaiahbjork/csm-voice-cloning.git
cd csm-voice-cloning - 安装依赖库:
pip install -r requirements.txt
(包含PyTorch、Hugging Face transformers等核心组件) - 配置Hugging Face令牌:
- 在Hugging Face官网申请API令牌
- 通过
export HF_TOKEN="你的令牌"
设置环境变量
完成后可通过修改voice_clone.py中的音频路径、文本等参数进行语音生成。首次运行时需要下载约4GB的模型文件,请确保磁盘空间充足。
本答案来源于文章《CSM Voice Cloning:利用CSM-1B快速克隆声音》