マルチGPUアクセラレーション構成法
DiffSynth-Engineはテンソル並列計算によるマルチカードアクセラレーションを主要なステップでサポートしています:
- システムに複数のGPUがインストールされていることを確認する(A100を推奨)
- パイプラインの初期化時にGPUの数を指定するためのparallelismパラメータを追加
- use_cfg_parallel=Trueを有効にして並列計算を使用する。
実際の効果例
ワン2.1ビデオ生成にて:
- 1枚のカードで2秒間のビデオを生成するのに358秒(A100)
- 4枚並列で114秒に短縮(3.14倍高速化)
典型的な構成コード:pipe = WanVideoPipeline.from_pretrained(config, parallelism=4, use_cfg_parallel=True)
ほら
1.GPUの数と並列度パラメータが一致する必要がある。
2.加速比はGPU数に応じて非線形に増加する
3.最良の結果を得るためには、24GB以上のビデオメモリを搭載したプロ仕様のグラフィックカードを推奨します。
この答えは記事から得たものである。DiffSynth-Engine:オープンソースエンジン、FLUXの低既存デプロイメント用、Wan 2.1について































