FantasyTalking的安装和使用主要分为以下几个步骤:
前置条件:
- 需要支持CUDA的高性能GPU(推荐RTX 3090及以上,至少24GB显存)
- Python环境和PyTorch(版本≥2.0.0)
- 至少几十GB的可用磁盘空间用于存放模型
Installationsschritte:
- Klonen des Projektlagers:
git clone https://github.com/Fantasy-AMAP/fantasy-talking.git
- Installieren Sie die Abhängigkeitspakete:
pip install -r requirements.txt
- 下载三个必需模型:Wan2.1-I2V-14B-720P、Wav2Vec和FantasyTalking权重,可通过Hugging Face或ModelScope下载
基本使用方法:
Führen Sie das Argumentationsskript aus:python infer.py --image_path 图像路径 --audio_path 音频路径
,其中图像支持PNG/JPG格式,音频建议使用16kHz采样率的WAV格式以获得最佳效果。
还可通过--prompt
参数添加提示词控制角色行为,例如:--prompt "人物正在热情演讲,双手不断挥动"
.
Diese Antwort stammt aus dem ArtikelFantasyTalking: ein Open-Source-Tool zur Erstellung realistisch sprechender PorträtsDie