Requisitos de hardware em detalhes
De acordo com a documentação oficial, os requisitos de hardware do LatentSync são classificados comoinferênciaresponder cantandotremDois cenários:
Configuração básica de raciocínio
- placa de vídeo (computador)Placa de vídeo NVIDIA (suporte CUDA necessário) com ≥6,8 GB de memória de vídeo (por exemplo, RTX 3060)
- sistemasLinux ou Windows (o Windows requer ajuste manual do script)
- ambiente de softwarePython 3.10 + Git + PyTorch (com suporte a CUDA)
Configuração de treinamento avançado
- Placas de vídeo recomendadasRTX 3090 (24 GB) e superior
- Requisitos de memória VGA::
- stage1.yaml Configuração: 23 GB
- stage2_efficient.yaml Configuração: 20 GB (melhor custo-benefício)
- Stage2.yaml completo: 30 GB (usuários profissionais)
- espaço de armazenamentoSão necessários mais de 10 GB de espaço para armazenar modelos e dados de treinamento.
*Observação: os requisitos reais variam de acordo com a resolução do vídeo (padrão 256×256) e o tempo de processamento.
Essa resposta foi extraída do artigoLatentSync: uma ferramenta de código aberto para gerar vídeo com sincronização labial diretamente do áudioO