Video Starter Kit的视频生成引擎采用了两阶段创作模式:
- 文本驱动:输入自然语言描述(如”夕阳下的城市天际线”),系统首先调用Stable Diffusion生成关键帧,再通过视频扩散模型生成5-10秒动态片段
- 图像引导:上传JPEG/PNG文件后,工具会分析图像语义特征,自动补间生成连贯动画,支持分辨率最高2048×2048
底层使用海螺视频模型实现图像到视频的转换,单个片段生成耗时约2-5分钟(取决于服务器负载)。生成参数包括:帧率(24/30/60fps)、风格滤镜(8种预设)、运动强度(0-100%)等可调选项,输出格式为MP4(H.264编码)。
This answer comes from the articleAI Video Starter Kit: Full-flow creation and editing of AI videos in the browserThe