Open-Soraは、発電の質を向上させるために3つの核となる最適化を提供する:
- 詳細記述法例:「海」を「嵐の中の紺碧の海、黒い岩礁に打ちつける白波、暗い雲間から稲妻が光る」に最適化する。
- GPT-4oアシスト最適化GPT-4oは、以下の方法で設定できます。
OPENAI_API_KEY
自動サジェストによる単語の最適化を有効にします:export OPENAI_API_KEY=sk-xxxx torchrun ... --refine-prompt True
- ダイナミックな得点調整スルー
--motion-score
パラメーター(範囲1~7)は、スクリーンのダイナミズムの度合いをコントロールする。
その他の最適化の提案は以下の通り:
- テキストから画像、動画への変換プロセスは、通常、テキストから動画への直接変換よりも高品質である。
- 複雑なシーンでは、HDバージョンを生成する前に、256pバージョンを生成して効果を確認することをお勧めします。
- 利用する
--offload True
グラフィックス・メモリが少ないときにメモリの最適化を有効にするためのパラメータです。
この答えは記事から得たものである。Open Sora:顔の一貫性を最適化するオープンソースのビデオ生成ツールについて