视频生成基础流程
- 准备文本提示:创建包含视频描述文本的文件(如prompt.txt)
- 运行生成命令:
python generate_video.py --input prompt.txt --output video.mp4
- 获取输出:生成的MP4格式视频将保存至指定路径
高级使用技巧
参数优化建议:
根据官方提供的参考表格,推荐的推理设置:
- Step-Video-T2V:30-50推理步骤,9.0的cfg缩放系数
- Turbo版本:10-15推理步骤,5.0的cfg缩放系数
双语输入支持:
可直接使用中文或英文文本提示,模型会自动解析不同语言。例如可以输入”飞机在蓝天中飞翔”或”An airplane flying in the blue sky”。
视频长度控制:
通过调整num_frames参数可控制生成视频的帧数,最大支持204帧。
本答案来源于文章《Step-Video-T2V:支持多语言输入和长视频生成的文生视频模型》