Open-Sora提供了三种核心优化方式来提升生成质量:
- 詳細記述法:建议使用具体、生动的描述词,例如将”大海”优化为”暴风雨中的深蓝色海洋,白色浪花猛烈拍打黑色礁石,乌云中透出闪电”
- GPT-4o辅助优化:系统内置了与GPT-4o的接口,可通过设置
OPENAI_API_KEY
后启用自动提示词优化:export OPENAI_API_KEY=sk-xxxx torchrun ... --refine-prompt True
- 动态评分调整スルー
--motion-score
参数(范围1-7)控制画面动态程度,例如设置7可以生成更剧烈的运动效果
额外的优化建议包括:
- 文本转图像再转视频的流程通常比直接文本到视频质量更高
- 对于复杂场景,建议先生成256p版本检查效果,再生成高清版
- 利用する
--offload True
参数可以在显存不足时启用内存优化
この答えは記事から得たものである。Open Sora:顔の一貫性を最適化するオープンソースのビデオ生成ツールについて