O "Thinking Mode" é um recurso alternável no GLM-4.5V projetado para equilibrar a eficiência da tarefa com a necessidade de raciocínio profundo:
- Função:Quando ativado, o modelo investe mais tempo na análise das informações e na geração de respostas mais precisas e lógicas, mas o tempo de resposta é relativamente lento.
- Cenários aplicáveis:
- Análise de gráficos complexos (por exemplo, interpretação de dados de relatórios financeiros).
- Geração de código ou resumo de documentos longos (requer várias rodadas de raciocínio).
- Tarefas de posicionamento visual que exigem saída de coordenadas de alta precisão.
Para perguntas e respostas simples (por exemplo, "quantas pessoas estão na foto"), o modo padrão pode ser usado diretamente para obter uma resposta rápida. Os usuários podem usar a opçãothinking
para alternar esse modo manualmente.
Essa resposta foi extraída do artigoGLM-4.5V: um modelo de diálogo multimodal capaz de compreender imagens e vídeos e gerar códigoO