Open-Soraはビデオパラメーターを非常に柔軟に設定できる:
- 分解能範囲144pから768pまでの複数の解像度出力をサポートし、バージョン2.0では256pと768pが標準となった。
- デュレーションコントロール2秒から16秒までのビデオクリップを生成できます。
--num_frames
フレーム数を正確にコントロールするパラメータ(最大129フレームまで対応) - アスペクト比一般的に使用される様々な比率をサポート:
- 横長16:9(従来のビデオ用)
- 縦9:16(モバイル機器向けに調整)
- 正方形1:1(ソーシャルメディアでよく使われる)
- その他のカスタム比率
実際には、これらの設定はコマンドラインパラメーターと柔軟に組み合わせることができる。例えば、768pの垂直ビデオを生成する場合:
torchrun ... --aspect_ratio 9:16 --resolution 768x1365
高解像度のビデオ生成にはより多くのGPUリソースが必要であり、768pビデオの並列処理には8GPUが推奨されることは注目に値する。
この答えは記事から得たものである。Open Sora:顔の一貫性を最適化するオープンソースのビデオ生成ツールについて