DiffSynth-Engine特别优化了推理速度,支持张量并行计算,能够有效加速大规模生成任务。这一功能在视频生成等计算密集型任务中表现尤为突出。
以Wan2.1模型为例,单卡生成2秒视频需要358秒。但使用4张A100 GPU并开启张量并行(parallelism=4, use_cfg_parallel=True)后,时间可缩短至114秒,加速比高达3.14倍。同样地,使用2张GPU时也能获得1.97倍的加速效果。这些性能优化使得DiffSynth-Engine特别适合工业级部署和批量生成任务。
本答案来源于文章《DiffSynth-Engine:低现存部署FLUX、Wan2.1的开源引擎》