硬件需求详解
根据官方文档,LatentSync 对硬件的要求分为推論歌で応える電車两种场景:
基础推理配置
- ディスプレイカード:NVIDIA 显卡(需支持 CUDA),显存 ≥6.8GB(如 RTX 3060)
- システム:Linux 或 Windows(Windows 需手动调整脚本)
- ソフトウェア環境:Python 3.10 + Git + PyTorch(带 CUDA 支持)
进阶训练配置
- 推奨グラフィックスカード:RTX 3090(24GB)及以上
- 必要VGAメモリ::
- stage1.yaml 配置:23GB
- stage2_efficient.yaml 配置:20GB(最优性价比)
- 完整 stage2.yaml:30GB(专业用户)
- 収納スペース:需预留 10GB+ 空间存放模型和训练数据
*注:实际需求会随视频分辨率(默认 256×256)和处理时长变化
この答えは記事から得たものである。LatentSync: 音声から直接リップシンクされたビデオを生成するオープンソースツールについて