CUDAビデオメモリ不足の問題を解決する3つの方法
CSMボイスクローニングでは、モデルの推論にGPUを使用しているため、ローカルのグラフィックスカードのビデオメモリが不足すると、推論が中断されることがあります。以下は、ステップバイステップの解決策です:
- 方法1:オーディオサンプルを短くする
入力される音声サンプルを30秒から1分にカットし、グラフィックスのメモリフットプリントを大幅に削減します。発音の最も明瞭な部分をキャプチャするには、Audacityなどのツールを使用することをお勧めします。 - 方法2:クラウドでの実行に切り替える
モーダル・プラットフォームを通じてクラウドGPUを使用する:- モーダルクライアントをインストールします:
pip install modal - アカウントを設定する:
modal token new - クラウドスクリプトを実行する:
modal run modal_voice_cloning.py
- モーダルクライアントをインストールします:
- 方法3:モデル・パラメーターの調整
models.pyのmax_seq_lenパラメータを変更し、2048または1024に下げます。
この答えは記事から得たものである。CSMボイスクローニング:CSM-1Bによる高速ボイスクローニングについて































