高性能计算需求保障生成质量
框架基于PyTorch 2.1+构建,强制要求:1) NVIDIA Turing架构以上显卡;2) CUDA 11.8驱动环境;3) 显存容量≥16GB。测试显示,生成1080p分辨率4D场景时,RTX 4090耗时约3分钟/帧,而RTX 2080会出现显存溢出。项目团队提供Docker镜像简化部署,内含预编译的FlashAttention优化内核。针对计算资源受限场景,建议使用CamVid-30K的480p子集进行原型验证。
This answer comes from the articleGenXD: open source framework for generating videos of arbitrary 3D and 4D scenesThe