本地安装CSM Voice Cloning需要满足特定硬件和软件环境,以下是详细步骤:
先行要件:
- ソフトウェア:NVIDIA CUDA兼容显卡(需足够显存)
- ハードウェア:Python 3.10+版本
- 網目:能稳定下载模型及依赖项
インストールプロセス:
- コードリポジトリをクローンする:
git clone https://github.com/isaiahbjork/csm-voice-cloning.git
cd csm-voice-cloning - 依存ライブラリをインストールする:
pip install -r requirements.txt
(包含PyTorch、Hugging Face transformers等核心组件) - 配置Hugging Face令牌:
- 在Hugging Face官网申请API令牌
- とおす
export HF_TOKEN="你的令牌"
環境変数の設定
完成后可通过修改voice_clone.py中的音频路径、文本等参数进行语音生成。首次运行时需要下载约4GB的模型文件,请确保磁盘空间充足。
この答えは記事から得たものである。CSMボイスクローニング:CSM-1Bによる高速ボイスクローニングについて