ComfyUI-WanVideoWrapper提供了三大核心视频生成功能:
1. 图像转视频(I2V)
将静态图片转为动态视频,支持自定义帧数和分辨率。典型工作流程需要加载Wan2.1 I2V模型、VAE模型,通过WanVideoSampler设置帧数(如81帧),最终使用VHS_VideoCombine节点输出视频。
2. 文本转视频(T2V)
根据文字描述生成视频,支持使用原生的T5文本编码器或ComfyUI的CLIP模型。官方测试显示1.3B T2V模型生成1025帧视频占用5GB显存,在RTX 5090上耗时约10分钟。
3. 视频到视频(V2V)
可对已有视频进行增强或风格转换,保持动作流畅性。需先使用VHS_LoadVideo节点加载原始视频,经过WanVideoEncode编码后,由WanVideoSampler进行增强处理。
此外,还支持长视频生成功能,通过设置窗口大小(如81帧)和重叠值(如16)来确保超长视频的动作连贯性。
本答案来源于文章《基于Wan2.1为ComfyUI提供视频生成能力的插件》