O HunyuanWorld-1.0 é uma ferramenta de geração de cenas 3D de código aberto desenvolvida pela equipe Hunyuan da Tencent, que é capaz de gerar cenas 3D por meio daDescrição de texto ou imagem únicaGerar rapidamente mundos 3D interativos de 360°. O projeto é baseado na estrutura Flux e é compatível com modelos de geração de imagens, como o Stable Diffusion, que é adequado para realidade virtual, desenvolvimento de jogos e produção de filmes. Os principais recursos incluem:
- Texto para o mundo 3DDigite uma breve descrição de texto para gerar uma cena 3D panorâmica
- Imagem para o mundo 3DCriação de ambientes 3D a partir de uma única imagem
- técnica de camadas semânticasSeparação automática de objetos em primeiro plano e em segundo plano para dar suporte à edição independente
- Exportação em vários formatosSaída de arquivos .obj e .glb, compatível com o mecanismo Blender/Unity/Unreal
- Visualização ao vivo do navegadorVisualização do efeito gerado diretamente por meio do modelviewer.html
A ferramenta usa geração de agentes panorâmicos e técnicas de reconstrução hierárquica em 3D para oferecer maior consistência visual e geométrica do que outros modelos de código aberto, e os pesos do modelo e o código-fonte são totalmente divulgados.
Essa resposta foi extraída do artigoHunyuanWorld-1.0: Geração de mundos 3D 360° interativos a partir de texto ou imagensO