安装OmniAvatar的主要步骤如下:
- 克隆代码仓库:通过git clone命令获取项目代码
- 安装依赖:需要Python环境和PyTorch等依赖库
- 下载预训练模型:通过huggingface-cli下载所需的模型权重
- 准备输入文件:创建包含音频路径和文本提示的输入文件
- 运行推理脚本:使用torchrun命令开始生成视频
硬件要求方面:
- 14B参数模型需要高性能GPU,如NVIDIA A6000等数据中心级显卡
- 1.3B参数模型可在8GB VRAM的消费级显卡上运行
- 安装flash_attn可加速注意力计算,提高生成速度
对于普通用户,建议从1.3B模型开始尝试;如需更高画质和效果,再考虑使用14B模型。
Essa resposta foi extraída do artigoOmniAvatar: geração de vídeos de avatar de corpo inteiro com áudioO