CamVid-30Kは動的シーン研究のベンチマークを再定義する
このデータセットには、VIPSegとOpenVidを含む3つの主要なサブセットが含まれ、カメラの位置、物体の動きの軌跡などの4次元要素を完全に記録しており、データ規模は30TBのレベルに達している。その特徴は、1)COLMAPフォーマットに格納された正確なカメラパラメータがミリメートルレベルの動き再構成をサポートすること、2)連続的なフレーム間オプティカルフローアノテーションがタイミングの整合性検証を実現すること、3)WebVid-10Mサブセットが多様なシーン素材を提供すること、である。実験的には、このデータセットを用いて学習したモデルが、学術論文のベンチマークプラットフォームとして一般的なNeRF動き再構成タスクにおいて、PSNRメトリックを12.7%向上させることが実証された。このデータセットはCC-BY-NCプロトコルに従い、PyTorchエコシステムに統合されている。
この答えは記事から得たものである。GenXD: 任意の3Dおよび4Dシーンのビデオを生成するためのオープンソースフレームワークについて































