GenXD-Framework behebt wichtige Engpässe bei der 3D/4D-Generierung
GenXD, das gemeinsam von der NUS und Microsoft entwickelt wurde, überwindet die Herausforderungen der Industrie durch drei innovative Mechanismen: Erstens bietet der bahnbrechende CamVid-30K-Datensatz des Projekts mehr als 30.000 kommentierte Videos, um die Lücke bei den Trainingsdaten für dynamische Szenen zu schließen; zweitens erreicht das einzigartige Multi-View-Zeitmodul eine genaue Entkopplung der Kamera- und Objektbewegungen, was die 30% im Vergleich zum traditionellen Single-Motion-Modellierungsschema verbessert Schließlich verwendet das Framework eine hierarchische Generierungsarchitektur, die flexible Eingaben von Einzelbildern bis hin zu Multiview-Sequenzen unterstützt und es Forschern ermöglicht, algorithmische Verbesserungen schnell zu validieren. Die Technik wurde im ICLR 2025 indiziert und ist seit 3 Monaten mit mehr als 2.000 Starmarks auf GitHub verfügbar, was ihren doppelten akademischen und technischen Wert beweist.
Diese Antwort stammt aus dem ArtikelGenXD: Open-Source-Framework zur Erzeugung von Videos beliebiger 3D- und 4D-SzenenDie




























