基本的な使用プロセス
- オーディオファイルの準備.wavまたは.mp3形式のモノラル・オーディオ・ファイルを、サンプリング・レート16kHzで使用することをお勧めします。
- メインプログラムの実行::
python main.py --audio_path your_audio_file.wav - 結果を見るプログラムはスクリーンにアニメーションを表示するか、ビデオファイルを生成します。
高度な機能操作
- リアルタイム入力モード::
python main.py --live
マイクによるリアルタイム音声入力 - 出力ビデオ保存::
outputパラメータを追加して保存パスを指定する。 - パラメタリゼーションフレームレート、マウス感度、その他のパラメータは必要に応じて調整可能
ほら
- 最初の実行のために、事前に訓練されたモデルをダウンロードする必要がある場合があります。
- 複雑なオーディオは処理に時間がかかる場合がある
- 最良の結果を得るためには、静かな録音環境をお勧めします。
この答えは記事から得たものである。LiteAvatar:CPU上で30fpsで動作する、リアルタイムでインタラクティブなデジタル人物の音声駆動型2Dポートレートについて































