Os modelos da série GLM-4.5 têm requisitos de hardware diferentes:
- GLM-4.5-Air (Lite)CPUs com 32 GB de RAM também podem ser executadas, mas com menos eficiência
- Versão completa do GLM-4.5Recomendado para ambientes com várias GPUs, requer aproximadamente 32 GB de memória de vídeo
- Requisitos geraisCUDA 11.8+: requer driver de GPU CUDA 11.8+, ambiente Python 3.8+
Para a implantação na nuvem, recomenda-se usar a estrutura de serviço vLLM, que pode levar mais tempo para ser compilada. Os desenvolvedores também podem escolher a versão pré-compilada fornecida pela Hugging Face para reduzir a dificuldade de implementação.
Essa resposta foi extraída do artigoGLM-4.5: grandes modelos multimodais de código aberto que suportam raciocínio inteligente e geração de códigoO