O projeto garante a consistência na geração de vários ângulos por meio de duas tecnologias principais:
1. módulo de aparência dupla (DAM)
- Uso de um espaço de características latentes compartilhado para restringir a relação de mapeamento de características frontais e dorsais
- Estabelecimento de associações semânticas entre perspectivas por meio de mecanismos de atenção cruzada
- Manutenção da coerência estrutural facial usando funções de perda de percepção geométrica
2. aprimoramentos do ControlNet
- Raciocínio sobre hipóteses geométricas para regiões invisíveis (por exemplo, a parte de trás da cabeça)
- Previsão da distribuição de cores com base na imagem de entrada Material do verso
- Otimização progressiva da consistência dos detalhes por meio do processo de redução de ruído do modelo de difusão
Vantagem do portfólio de tecnologia::
Com base no trabalho anterior de PanoHead et al., a precisão da reconstrução NeRF foi aprimorada em 341 TP3T (dados da tese), melhorando especialmente a naturalidade das regiões de transição, como a linha do cabelo e a orelha. Os experimentos mostram que o método mantém a consistência estrutural da qualidade gerada para ângulos de visualização extremos (deflexão >150°).
Essa resposta foi extraída do artigoDiffPortrait360: gere visualizações de cabeça em 360 graus a partir de um único retratoO