CSMボイスクローニングのローカル・インストールには、以下に示す特定のハードウェアおよびソフトウェア環境が必要です:
先行要件:
- ソフトウェアNVIDIA CUDA対応グラフィックカード(十分なビデオメモリが必要です。)
- ハードウェアPythonバージョン3.10以上。
- 網目モデルと依存関係の安定したダウンロード
インストールプロセス:
- コードリポジトリをクローンする:
git clone https://github.com/isaiahbjork/csm-voice-cloning.git
cd csm-voice-cloning - 依存ライブラリをインストールする:
pip install -r requirements.txt
(PyTorch、ハギング・フェイス・トランスフォーマーなどのコア・コンポーネントを含む)。 - ハギング・フェイス・トークンを設定する:
- ハギング・フェイスのウェブサイトでAPIトークンを申請する
- とおす
export HF_TOKEN="你的令牌"環境変数の設定
完了後、voice_clone.pyで音声パスやテキストなどのパラメータを変更して音声を生成することができます。初回実行時には約4GBのモデルファイルをダウンロードする必要がありますので、十分なディスク容量を確保してください。
この答えは記事から得たものである。CSMボイスクローニング:CSM-1Bによる高速ボイスクローニングについて































