Processo de uso básico
- Preparação de arquivos de áudioRecomendamos o uso de arquivos de áudio mono no formato .wav ou .mp3, com uma taxa de amostragem de 16kHz para obter melhores resultados.
- Executar o programa principal::
python main.py --audio_path your_audio_file.wav - Exibir resultadosO programa exibe uma animação na tela ou gera um arquivo de vídeo
Operação de funções avançadas
- Modo de entrada em tempo real::
python main.py --live
Entrada de áudio em tempo real usando um microfone - Saída de vídeo Salvar::
Adicione o parâmetro -output para especificar o caminho de salvamento - parametrizaçãoTaxa de quadros, sensibilidade da boca e outros parâmetros podem ser ajustados conforme necessário
advertência
- Pode ser necessário fazer o download de modelos pré-treinados para a primeira execução
- O áudio complexo pode levar mais tempo para ser processado
- Recomenda-se um ambiente de gravação silencioso para obter os melhores resultados
Essa resposta foi extraída do artigoLiteAvatar: retratos 2D orientados por áudio de pessoas digitais interativas em tempo real, executados a 30 fps na CPUO































