O GLM-4.5V suporta um comprimento máximo de saída de 64 mil tokens, um recurso que permite lidar com a tarefa de gerar textos extremamente longos ou conteúdo multimodal complexo. O recurso de suporte a contextos longos permite que o modelo analise profundamente dezenas de páginas de documentos, gere arquivos de código completos ou analise conteúdo de vídeo longo. Para obter um equilíbrio de eficiência em diferentes cenários, o modelo também apresenta um inovador interruptor "Thinking Mode", que permite ao usuário escolher entre os modos de resposta rápida ou de raciocínio profundo de acordo com os requisitos da tarefa, sendo o primeiro adequado para interações em tempo real e o segundo para cenários que exigem análises lógicas complexas.
Essa resposta foi extraída do artigoGLM-4.5V: um modelo de diálogo multimodal capaz de compreender imagens e vídeos e gerar códigoO