基本使用流程
- 准备音频文件:建议使用.wav或.mp3格式的单声道音频文件,采样率16kHz效果最佳
- 运行主程序:
python main.py --audio_path your_audio_file.wav
- 查看结果:程序会在屏幕上显示动画或生成视频文件
高级功能操作
- 实时输入模式:
python main.py --live
使用麦克风实时输入音频 - 输出视频保存:
添加–output参数指定保存路径 - 参数调整:可根据需要调整帧率、口型灵敏度等参数
注意事项
- 首次运行时可能需要下载预训练模型
- 复杂的音频可能需要更长的处理时间
- 建议在安静的录音环境下获取最佳效果
本答案来源于文章《LiteAvatar:音频驱动2D人像的实时互动数字人,CPU运行30fps》