A implementação do HunyuanWorld-1.0 exige que os seguintes requisitos sejam atendidosRequisitos de hardware e software::
- Configuração da GPUGPUs: NVIDIA A100 (33 GB de memória de vídeo) recomendada, RTX 3090 (24 GB) mínima necessária. As GPUs testadas com 12 GB de memória de vídeo podem não ser capazes de concluir o processo de geração completo.
- dependência de softwareO projeto usa o conda para o gerenciamento do ambiente (arquivo de configuração HunyuanWorld.yaml fornecido).
- componente essencialBibliotecas de dependência adicionais, como Real-ESRGAN (aprimoramento de imagem), ZIM (suporte à segmentação semântica) e Draco (compactação .glb), precisam ser instaladas.
- espaço de armazenamentoOs pesos do modelo de pré-treinamento têm cerca de 15 GB e é recomendável preparar mais de 50 GB de espaço em disco.
- condição da redeObservação: É necessário visitar a Hugging Face para fazer download dos pesos do modelo, e os usuários domésticos podem precisar configurar espelhos de aceleração.
O processo de instalação consiste em 8 etapas: clonagem da base de código → criação do ambiente conda → instalação do Real-ESRGAN → configuração da segmentação ZIM → instalação opcional do Draco → login no HuggingFace → verificação da disponibilidade da GPU. Depois que o ambiente for configurado com sucesso, você poderá passar o comandotorch.cuda.is_available()
Retorna True para confirmar.
Essa resposta foi extraída do artigoHunyuanWorld-1.0: Geração de mundos 3D 360° interativos a partir de texto ou imagensO