Verfahren zur Konfiguration der Multi-GPU-Beschleunigung
DiffSynth-Engine unterstützt Multi-Card-Beschleunigung durch Tensor-Parallel-Computing, in großen Schritten:
- Vergewissern Sie sich, dass auf dem System mehrere GPUs installiert sind (A100 empfohlen)
- Hinzufügen des Parameters Parallelität zur Angabe der Anzahl der GPUs während der Initialisierung der Pipeline
- Aktivieren Sie use_cfg_parallel=True, um die parallele Datenverarbeitung zu nutzen.
Beispiel für die tatsächliche Wirkung
In Wan 2.1 Video Generation:
- 358 Sekunden für die Erstellung von 2 Sekunden Video auf einer einzigen Karte (A100)
- Reduziert auf 114 Sekunden mit 4 Karten parallel (3,14x Beschleunigung)
Typischer Konfigurationscode:pipe = WanVideoPipeline.from_pretrained(config, parallelism=4, use_cfg_parallel=True)
caveat
1. die Anzahl der GPUs und der Parallelitätsparameter müssen übereinstimmen.
2. das Beschleunigungsverhältnis steigt nichtlinear mit der Anzahl der GPUs
3. eine professionelle Grafikkarte mit mindestens 24 GB Videospeicher wird für beste Ergebnisse empfohlen.
Diese Antwort stammt aus dem ArtikelDiffSynth-Engine: Open-Source-Engine für den Einsatz von FLUX mit geringem Umfang, Wan 2.1Die































