低メモリ・デバイス向け性能最適化ガイド
ビデオメモリが8GB未満のGPUデバイスの場合、以下のマルチレベル最適化スキームを使用することができます:
- コアパラメータの調整
- 強制有効化 -num_persistent_param_in_dit 0: ビデオメモリ使用量を ~30% 削減
- use_teacacheを設定し、-teacache_threshを0.4~0.5にする。
- サイズのマルチトーク-480の採用により、必要な解像度を低減
- セグメンテーション技術
- 長い動画には-modeストリーミングを使う。
- 各セグメントの長さは15秒以内にすることが推奨される。
- 段落間の一貫性は-segment_overlap 5によって維持される。
- 環境最適化
- 最新のCUDAドライバーをインストールする
- PYTORCH_CUDA_ALLOC_CONF="max_split_size_mb:32″を設定します。
- conda clean -allを使って定期的にキャッシュを掃除する。
実際、12GBのビデオメモリーデバイスは720pの長尺動画を生成するのに最適化されており、8GBのデバイスは480pの短尺動画を安定して出力できる。
この答えは記事から得たものである。MultiTalk:複数人の会話ビデオを生成する音声駆動ツールについて































