Processo de uso básico
- Preparação de arquivos de áudio:建议使用.wav或.mp3格式的单声道音频文件,采样率16kHz效果最佳
- Executar o programa principal::
python main.py --audio_path your_audio_file.wav
- Exibir resultados:程序会在屏幕上显示动画或生成视频文件
Operação de funções avançadas
- 实时输入模式::
python main.py --live
使用麦克风实时输入音频 - 输出视频保存::
添加–output参数指定保存路径 - parametrização:可根据需要调整帧率、口型灵敏度等参数
advertência
- 首次运行时可能需要下载预训练模型
- 复杂的音频可能需要更长的处理时间
- 建议在安静的录音环境下获取最佳效果
Essa resposta foi extraída do artigoLiteAvatar: retratos 2D orientados por áudio de pessoas digitais interativas em tempo real, executados a 30 fps na CPUO