Os três modos de aprimoramento de vídeo oferecidos pelo SVLS correspondem a diferentes cenários de uso e implementações técnicas:
1. nenhum modo de aprimoramento (nenhum)
- especificidadesPreservação total da qualidade do vídeo original, somente sincronização labial
- Cenários aplicáveisUsado quando o próprio vídeo de entrada é de alta qualidade (por exemplo, filmado por uma câmera de vídeo profissional) ou quando o estilo original precisa ser mantido
- velocidade de processamentoMais rápido, sem necessidade de recursos adicionais de computação
2. modo de aprimoramento de lábios (lip)
- especificidadesAprimoramento especializado dos lábios e das áreas circundantes usando técnicas de super-resolução (normalmente de 20 a 30 pixels)
- Cenários aplicáveisQuando há necessidade de destacar a precisão da articulação ou quando o vídeo original tem resolução insuficiente na área dos lábios
- de pontaVolume computacional moderado, melhora significativamente a visibilidade da articulação
3. modo de aprimoramento de rosto inteiro (rosto)
- especificidadesAprimoramento de toda a área facial, incluindo a textura da pele, detalhes do cabelo, etc.
- Cenários aplicáveisQuando o vídeo requer close-ups de alta qualidade ou quando o vídeo original apresenta artefatos de compressão significativos
- tomar nota de: o mais intensivo em termos de computação e pode exigir suporte de GPU mais potente
Orientação para seleçãoPara a maioria dos cenários de aplicação, é recomendável experimentar primeiro o modo de lábios; se precisar usar o modo de rosto novamente para obter qualidade de filme; ao lidar com filme original 4K ou efeitos artísticos especiais, escolha o modo nenhum. Você pode fazer uma pequena amostra de filme para comparar os três efeitos antes de tomar uma decisão.
Essa resposta foi extraída do artigoSVLS: SadTalker aprimorado para gerar pessoas digitais usando vídeo de retratoO































