Qwen3-8B-BitNet提供两种特色推理模式:
- padrão de pensamento(enable_thinking=True):适合复杂逻辑任务,会生成详细的推理过程。例如处理数学方程式时,会逐步展示解题步骤
- modus vivendi(enable_thinking=False):响应速度更快,适用于简单问答或日常对话场景
模式切换方法:
在调用apply_chat_template函数时,通过设置enable_thinking参数进行切换。典型的代码示例:
# 启用思考模式
text = tokenizer.apply_chat_template(messages,
tokenize=False,
enable_thinking=True)
# 禁用思考模式
text = tokenizer.apply_chat_template(messages,
tokenize=False,
enable_thinking=False)
实际使用中,建议对需要逐步分析的任务启用思考模式,对时效性要求高的简单任务使用非思考模式。
Essa resposta foi extraída do artigoQwen3-8B-BitNet: um modelo de linguagem de código aberto para compactação eficienteO