LHMs 3D-Rekonstruktionsfähigkeiten für Menschen
LHM ist ein quelloffenes Modell zur 3D-Rekonstruktion des menschlichen Körpers, das auf KI-Technologie basiert und eine fortschrittliche 3D-Gaussian-Splatting-Technologie sowie eine multimodale Transformatorarchitektur verwendet. Es ist in der Lage, hochpräzise 3D-Modelle in Sekundenschnelle aus einem einzigen 2D-Bild des menschlichen Körpers zu erstellen, wobei detaillierte Merkmale wie die Textur der Kleidung erhalten bleiben. Im Vergleich zu herkömmlichen Modellierungsmethoden, die Stunden oder sogar Tage an manueller Arbeit erfordern, reduziert LHM den Prozess auf Sekunden.
Das System ist insofern einzigartig, als es 1) Echtzeit-Rendering und Posenanpassung unterstützt, 2) Standard-3D-Mesh-Dateien (z. B. OBJ-Format) ausgeben kann und 3) eine Vielzahl von Pre-Training-Modelloptionen (LHM-0.5B/LHM-1B) bietet. Testdaten zeigen, dass die Inferenz auf einer A100-Grafikkarte nur 0,2 Sekunden und auf einer 4090-Grafikkarte etwa 1-2 Sekunden dauert, was die Effizienz der Produktion von 3D-Inhalten erheblich verbessert.
Diese Antwort stammt aus dem ArtikelLHM: Generierung bewegungsfähiger 3D-Menschenmodelle aus einem einzigen BildDie