顔の一貫性を保つための主なテクニック
歪んだ特徴を持つビデオの生成を防ぐ方法:
- モデル選択:正しくロードされていることを確認する
FantasyTalking_model.ckpt
歌で応えるWan2.1-I2V-14B-720P
基本モデル - フォーカス強化:内蔵の
facial attention cross-attention
モジュールに--enable_fa_xattn
パラメトリック - 入力仕様:眼鏡の反射などの干渉を避けるため、正面顔に均一な照明が当たる写真を使用し、グリーンスクリーン・キーイング後の純粋なポートレートを推奨する。
- 後処理プログラム:出力ビデオ用
GFPGAN
フェイシャル・エンハンスメントを行う:python enhance.py --input video.mp4 --type face
主な測定基準:ランドマークのオフセットが5ピクセル未満の場合、歪みは人間の目にはほとんど感じられない。
この答えは記事から得たものである。FantasyTalking: リアルな似顔絵を生成するオープンソースツールについて