保持面部一致性的关键技术
防止生成视频出现五官变形的方法:
- 模型选择:确认已正确加载
FantasyTalking_model.ckpt
和Wan2.1-I2V-14B-720P
基础模型 - 专注力强化:启用内置的
facial attention cross-attention
模块,在命令中添加--enable_fa_xattn
参数 - 输入规范:使用正脸光照均匀的照片,避免眼镜反光等干扰,推荐使用绿幕抠像后的纯净人像
- 后处理方案:对输出视频使用
GFPGAN
进行面部增强,命令示例:python enhance.py --input video.mp4 --type face
关键指标:当面部关键点(Landmark)偏移量<5像素时,人眼几乎无法察觉失真
本答案来源于文章《FantasyTalking:生成真实感说话肖像的开源工具》