Seed-OSS提供了灵活的推理预算控制功能,用户可以通过thinking_budget参数动态调整推理长度,以平衡推理速度与深度。使用该功能的具体方法如下:
- 简单任务(如翻译):设置thinking_budget=128。
- 中等复杂度任务(如常规问答):建议thinking_budget=512。
- 复杂任务(如数学推理或代码生成):设置thinking_budget=1024。
该参数可以在生成脚本中直接设置,例如在Python代码中:
tokenized_chat = tokenizer.apply_chat_template(
messages,
tokenize=True,
add_generation_prompt=True,
return_tensors="pt",
thinking_budget=1024
)
通过调整这一参数,用户可以根据实际任务需求优化模型的推理效率和效果。
本答案来源于文章《Seed-OSS:开源大语言模型,支持长上下文推理与多功能应用》