O uso do MIDI-3D a partir da linha de comando envolve dois estágios principais:
Etapa 1: Geração de diagramas de segmentação
Execute o seguinte comando (como exemplo de uma imagem em estilo de desenho animado):
python -m scripts.grounding_sam --image assets/example_data/Cartoon-Style/04_rgb.png --labels "lamp sofa table dog" --output ./segmentation.png- Descrição do parâmetro:
– -imagemCaminho da imagem de entrada
– -RótulosLista de nomes de objetos separados por espaço
– -saídaOnde o mapa de segmentação gerado é salvo
Estágio 2: Geração de cena 3D
Use o script de raciocínio central:
python -m scripts.inference_midi --rgb 00_rgb.png --seg 00_seg.png --output-dir "./output" --do-image-padding- Dicas avançadas:
- adicionar-do-image-paddingParâmetros para otimizar a qualidade da geração de objetos de borda
- O diretório de saída gera automaticamente subpastas com registros de data e hora para evitar a substituição de arquivos
A geração típica leva cerca de 40 a 60 segundos, e é recomendável priorizar o uso de dados de exemplo fornecidos oficialmente para o teste do processo.
Essa resposta foi extraída do artigoMIDI-3D: uma ferramenta de código aberto para gerar rapidamente cenas 3D com vários objetos a partir de uma única imagemO































