Grundlegendes Nutzungsverfahren
- Vorbereiten von AudiodateienWir empfehlen die Verwendung von Mono-Audiodateien im .wav- oder .mp3-Format mit einer Abtastrate von 16 kHz, um optimale Ergebnisse zu erzielen.
- Starten Sie das Hauptprogramm::
python main.py --audio_path your_audio_file.wav - Ergebnisse anzeigen: Das Programm zeigt eine Animation auf dem Bildschirm an oder erzeugt eine Videodatei
Erweiterte Funktion Betrieb
- Echtzeit-Eingabemodus::
python main.py --live
Audioeingabe in Echtzeit über ein Mikrofon - Ausgang Video speichern::
Fügen Sie den Parameter -output hinzu, um den Speicherpfad anzugeben - ParametrisierungBildrate, Mundempfindlichkeit und andere Parameter können nach Bedarf eingestellt werden.
caveat
- Vorgefertigte Modelle müssen möglicherweise für den ersten Lauf heruntergeladen werden.
- Die Verarbeitung komplexer Audiodaten kann länger dauern
- Für beste Ergebnisse wird eine ruhige Aufnahmeumgebung empfohlen.
Diese Antwort stammt aus dem ArtikelLiteAvatar: Audio-gesteuerte 2D-Porträts von interaktiven digitalen Menschen in Echtzeit, die mit 30 Bildern pro Sekunde auf der CPU laufenDie































