基本的な使用プロセス
- オーディオファイルの準備:建议使用.wav或.mp3格式的单声道音频文件,采样率16kHz效果最佳
- メインプログラムの実行::
python main.py --audio_path your_audio_file.wav
- 結果を見る:程序会在屏幕上显示动画或生成视频文件
高度な機能操作
- 实时输入模式::
python main.py --live
使用麦克风实时输入音频 - 输出视频保存::
添加–output参数指定保存路径 - パラメタリゼーション:可根据需要调整帧率、口型灵敏度等参数
ほら
- 首次运行时可能需要下载预训练模型
- 复杂的音频可能需要更长的处理时间
- 建议在安静的录音环境下获取最佳效果
この答えは記事から得たものである。LiteAvatar:CPU上で30fpsで動作する、リアルタイムでインタラクティブなデジタル人物の音声駆動型2Dポートレートについて