A equipe obteve um controle preciso dos requisitos de hardware por meio das seguintes otimizações técnicas:
- Quantificação de pesos de modelos para compactação: manutenção da qualidade da geração com precisão de FP16
- Mecanismo de carregamento dinâmico: ative apenas os módulos de computação necessários para o processamento atual
- Algoritmo de lote inteligente: maximize a utilização da memória gráfica
Os dados medidos mostram que:
- A RTX 3060 (12 GB) lida perfeitamente com entradas de resolução de 4096 x 4096
- A GTX 1660 Super (6GB) atende às necessidades básicas da geração 1080p
- O tempo de geração aumenta linearmente, em vez de exponencialmente, com a resolução
Esse recurso permite que a ferramenta seja implantada em estações de trabalho pessoais de designers, laboratórios universitários e outros dispositivos não profissionais, expandindo significativamente a gama de aplicações. Um laboratório de mídia digital universitário pode oferecer suporte a 40 alunos para praticar a criação em 3D simultaneamente usando 20 computadores de ensino equipados com o RTX 3050.
Essa resposta foi extraída do artigoMIDI-3D: uma ferramenta de código aberto para gerar rapidamente cenas 3D com vários objetos a partir de uma única imagemO