O processo de geração pode ser dividido em três estágios:
1. preparação da entrada
- Selecione um retrato frontal (JPEG/PNG) com uma resolução de 512×512 ou superior
- Coloque a imagem na seção
input_image/
arquivo (papel) - pretender
dataset.json
Perfil da câmera (consulte o guia de corte do PanoHead)
2. raciocínio executivo
- Vá para o diretório de código:
cd diffportrait360_release/code
- Execute o script:
bash inference.sh
- Habilitar o ControlNet (opcional): modifique o script para adicionar a opção
--use_controlnet
parâmetros
3. processamento de resultados
- A saída contém uma sequência de visualizações de vários ângulos (salvas por padrão no arquivo
output/
) - Obtenha um arquivo de modelo .nerf que possa ser renderizado com ferramentas como o NeRFStudio.
- As sequências de imagens podem ser convertidas em vídeo com ferramentas como o FFmpeg
Para dados personalizados, é necessário garantir que os parâmetros da câmera sejam precisos, e é recomendável usar os dados de teste fornecidos pelo projeto (incluindo mais de 1.000 retratos reais) como padrão de referência.
Essa resposta foi extraída do artigoDiffPortrait360: gere visualizações de cabeça em 360 graus a partir de um único retratoO