ReSearch 的自动化搜索调用机制代表了新一代工具增强型语言模型的发展方向。其实时处理流程包含四个精密配合的阶段:
- 意图识别:使用 RL 策略网络评估问题是否需要外部知识(如最新数据或专业信息)
- 查询生成:将用户问题转换为包含关键实体和关系的搜索语句,例如将”木星卫星数量”转化为”Jupiter moons count 2025最新”
- 证据检索:通过 FlashRAG 服务获取前 5 篇相关文档,平均延迟控制在 300ms 内
- 多轮验证:当初始结果置信度不足时,自动发起补充搜索进行交叉验证
典型应用案例显示,对于”特斯拉2024年三季度财报关键数据”这类动态查询:
- 模型会生成精确的时间限定搜索词(Tesla Q3 2024 earnings report site:tesla.com)
- 从检索结果中提取营收、毛利率等结构化数据
- 按”总营收-成本开支-净利润”的逻辑链组织最终答案
该功能在 StrategyQA 上的测试表明,相比纯参数化模型可将事实准确率提升 37%。
本答案来源于文章《ReSearch:强化搜索推理能力的 Qwen2.5-7B 模型(实验)》