リップシンクの問題を解決する3つのステップ
リップデシンクロナイゼーションは通常、オーディオとビデオのサンプリングレートの不一致や、不適切なモデル推論パラメータによって引き起こされます。SVLSプロジェクトのドキュメントによると、以下の解決策があります:
- DAIN補間による流暢さの向上コマンドラインで追加
--use_DAIN --time_step 0.5パラメータは、ディープラーニングのフレームフィリングアルゴリズムにより、ビデオを25fpsから50fpsに引き上げ、動きの連続性を大幅に改善します。 - 正しい強化モードの選択実際の効果に応じて選択
--enhancer lip(または--enhancer face(フルフェイスエンハンスメント)、どちらのモードも超解像技術により主要部分のシャープネスを向上させます。 - 入力文書の品質チェックオーディオはサンプルレート16kHz以上のWAVファイルであること、ビデオは1080p以上の解像度で、フルフェイシャル機能が含まれていることを推奨します。
テストによると、DAINフレーム補間とリップエンハンスメントモードを同時にオンにした場合、リップシンクの精度は約32%向上します。--time_stepパラメーター(0.3~0.7レンジの微調整)。
この答えは記事から得たものである。SVLS: SadTalker、ポートレートビデオを使ってデジタル人物を生成する機能を強化について































