O SpatialLM é inovador em três dimensões principais:
- Avanço na compatibilidade de dadosSoftware de digitalização: Diferente do software comercial fornecido com equipamentos de digitalização profissionais (por exemplo, Matterport), ele pode lidar com nuvens de pontos de baixa qualidade capturadas por dispositivos de consumo, como câmeras de telefones celulares.
- Riqueza da semântica de saídaEnquanto as ferramentas tradicionais (CloudCompare) produzem principalmente malhas geométricas, a arquitetura LLM do SpatialLM pode anexar rótulos semânticos e atributos funcionais, como "cadeira de escritório - giratória".
- Flexibilidade interativa: Suporte
--category
Os parâmetros personalizam a categoria de detecção, por exemplo, identificando apenas prateleiras e empilhadeiras em cenários de armazém, reduzindo significativamente o consumo de computação.
Os testes mostram que, ao lidar com uma cena interna de 100 m2, a versão SpatialLM1.1-Qwen no RTX 4090 precisa de apenas 12 segundos para concluir a extração de elementos arquitetônicos + 20 tipos de detecção de objetos, 8 vezes mais rápido do que o pipeline tradicional.
Essa resposta foi extraída do artigoSpatialLM: Varra a sala e a IA desenha automaticamente o modelo 3D para você!O