准备工作
- 准备输入图片(PNG/JPG格式)
<li]创建example-images文件夹存放源图像
执行步骤
- 设置相机模式(forward前进或orbit环绕)
- 运行推理命令指定输入输出路径
- 调整参数包括:
- 仰角(elevation)
- 方位角范围(azimuth_range)
- 相机半径(radius)
典型命令示例
accelerate launch --main_process_port 1223 inference.py diffusion.pretrain_unet=./genxd-model ...
结果处理
生成的多视角3D视图保存在outputs目录,可使用Blender等工具进一步编辑。整个过程约需10-30分钟,具体时间取决于GPU性能。
本答案来源于文章《GenXD:生成任意3D和4D场景视频的开源框架》