SpatialLM ist in drei Hauptbereichen innovativ:
- Durchbruch bei der DatenkompatibilitätIm Unterschied zu kommerzieller Software, die mit professionellen Scannern gebündelt wird (z. B. Matterport), kann es Punktwolken von geringer Qualität verarbeiten, die mit einfachen Geräten wie Handykameras aufgenommen wurden.
- Reichtum der AusgabesemantikWährend herkömmliche Tools (CloudCompare) hauptsächlich geometrische Netze ausgeben, kann die LLM-Architektur von SpatialLM semantische Etiketten und funktionale Attribute wie "Bürostuhl - drehbar" hinzufügen.
- Interaktive Flexibilität: Unterstützung
--category
Parameter passen die Erkennungskategorie an, z. B. werden in Lagerszenarien nur Regale und Gabelstapler erkannt, was den Rechenaufwand erheblich reduziert.
Tests zeigen, dass die SpatialLM1.1-Qwen-Version auf der RTX 4090 bei einer 100 m2 großen Innenraumszene nur 12 Sekunden für die Extraktion der architektonischen Elemente und die Erkennung von 20 Objekttypen benötigt, also achtmal schneller als die herkömmliche Pipeline.
Diese Antwort stammt aus dem ArtikelSpatialLM: Durchstöbern Sie den Raum und AI zeichnet automatisch das 3D-Modell für Sie!Die