多层次清晰度提升方案
SVLS视频清晰度问题主要来自运动模糊和分辨率损失,项目提供了三种增强策略:
- 分级增强模式选择:
--enhancer none
:保持原始分辨率,适合高质量输入视频--enhancer lip
:仅对唇部区域应用超分辨率(推荐配置)--enhancer face
:全脸增强,消耗更多显存但细节更丰富
- 预处理优化:使用FFmpeg对源视频预先执行
-vf scale=1920:1080,unsharp=3:3:1.0
进行锐化处理 - 后处理方案:生成后通过Topaz Video AI进行二次增强
实测数据显示,使用lip
增强模式时,唇部区域的PSNR指标可提升5.8dB。对于4K输出需求,建议在1080P增强生成后,用Real-ESRGAN进行智能放大。
本答案来源于文章《SVLS:SadTalker增强版,使用人像视频生成数字人》