保持面部一致性的关键技术
防止生成视频出现五官变形的方法:
- モデル選択:确认已正确加载
FantasyTalking_model.ckpt
歌で応えるWan2.1-I2V-14B-720P
基本モデル - 专注力强化:启用内置的
facial attention cross-attention
模块,在命令中添加--enable_fa_xattn
パラメトリック - 输入规范:使用正脸光照均匀的照片,避免眼镜反光等干扰,推荐使用绿幕抠像后的纯净人像
- 后处理方案:对输出视频使用
GFPGAN
进行面部增强,命令示例:python enhance.py --input video.mp4 --type face
关键指标:当面部关键点(Landmark)偏移量<5像素时,人眼几乎无法察觉失真
この答えは記事から得たものである。FantasyTalking: リアルな似顔絵を生成するオープンソースツールについて