Processo de geração de texto para mundo 3DHá três etapas principais:
1. Preparação de dicas
Use frases simples para descrever a cena, por exemplo, "A medieval castle in the sunshine, surrounded by a moat" (Um castelo medieval sob o sol, cercado por um fosso). Evite modificadores complexos e dê suporte aos avisos em inglês e chinês.
2. Gerar imagens panorâmicas
Execute o comando de geração de núcleo:python3 demo_panogen.py --prompt "阳光下的中世纪城堡" --output_path test_results/castle
O panorama gerado será salvo no arquivo panorama.png no diretório especificado.
3. Criação de uma cena 3D
Geração de modelos 3D com camadas semânticas por meio de panoramas:CUDA_VISIBLE_DEVICES=0 python3 demo_scenegen.py --image_path test_results/castle/panorama.png --labels_fg1 castle --labels_fg2 river --classes outdoor --output_path test_results/castle
O parâmetro -labels_fg1/2 especifica os objetos de primeiro plano a serem colocados em camadas (por exemplo, castelos/rios) e -classes faz distinção entre cenas internas e externas.
O modelo 3D completo está disponível no siteTrês maneiras de usarPara obter uma visualização prévia, abra o modelviewer.html no navegador; exporte .obj/.glb para o Blender para edição; ou importe diretamente para o mecanismo Unity/Unreal. Todo o processo leva cerca de 30 a 60 minutos, desde a palavra-chave até a cena interativa (placa de vídeo A100).
Essa resposta foi extraída do artigoHunyuanWorld-1.0: Geração de mundos 3D 360° interativos a partir de texto ou imagensO