Basic usage flow
- Preparing Audio Files:建议使用.wav或.mp3格式的单声道音频文件,采样率16kHz效果最佳
- Run the main program::
python main.py --audio_path your_audio_file.wav
- View Results:程序会在屏幕上显示动画或生成视频文件
Advanced Function Operation
- 实时输入模式::
python main.py --live
使用麦克风实时输入音频 - 输出视频保存::
添加–output参数指定保存路径 - parameterization:可根据需要调整帧率、口型灵敏度等参数
caveat
- 首次运行时可能需要下载预训练模型
- 复杂的音频可能需要更长的处理时间
- 建议在安静的录音环境下获取最佳效果
This answer comes from the articleLiteAvatar: Audio-driven 2D portraits of real-time interactive digital people running at 30fps on the CPUThe