Open-Sora 2.0は、オープンソースのビデオ生成における大きなブレークスルーを確かに表している。公式データによると、VBenchレビューにおけるOpenAI Soraとの差はわずか0.69%であり、HunyuanVideo 11BやStep-Video 30Bといった商用グレードのモデルに迫るパフォーマンスである。 この成果は、わずか20万ドルのトレーニング費用で実現したものであり、アルゴリズム効率の優位性を強調している。
このプロジェクトの技術的な利点は、主に3つの側面に反映されています:第一に、推論速度、H100 GPU上の256×256解像度のビデオを生成するのにかかる時間はわずか60秒であること、第二に、768pまでの解像度をサポートしていること、最後に、xformersとflash-attnアクセラレーションライブラリによってハードウェアリソースの効率的な使用を実現していることです。これらの技術的な進歩により、Open-Sora 2.0は現在のオープンソースビデオ生成の最適なソリューションとなっています。
この答えは記事から得たものである。Open Sora:顔の一貫性を最適化するオープンソースのビデオ生成ツールについて