Método de configuração de aceleração multi-GPU
O DiffSynth-Engine oferece suporte à aceleração de vários cartões por meio da computação paralela de tensores, em etapas principais:
- Certifique-se de que o sistema tenha várias GPUs instaladas (recomenda-se a A100)
- Adicione o parâmetro de paralelismo para especificar o número de GPUs durante a inicialização do pipeline
- Habilite use_cfg_parallel=True para usar a computação paralela
Exemplo de efeito real
Em Wan 2.1 Geração de vídeo:
- 358 segundos para gerar 2 segundos de vídeo em um único cartão (A100)
- Reduzido para 114 segundos com 4 cartões em paralelo (aceleração de 3,14x)
Código de configuração típico:pipe = WanVideoPipeline.from_pretrained(config, parallelism=4, use_cfg_parallel=True)
advertência
1. o número de GPUs e o parâmetro de paralelismo precisam corresponder.
2. a taxa de aceleração aumenta de forma não linear com o número de GPUs
3. recomenda-se uma placa de vídeo profissional com 24 GB de memória de vídeo ou mais para obter melhores resultados.
Essa resposta foi extraída do artigoDiffSynth-Engine: Mecanismo de código aberto para baixa implantação existente do FLUX, Wan 2.1O































