该项目采用 BM25 关键词检索与 FAISS 向量相似度搜索相结合的混合检索方案,相比单一检索方式具有显著优势。BM25 算法负责处理精确术语匹配,有效捕捉用户查询中的核心关键词;FAISS 则通过稠密向量检索理解语义相关性,两者协同工作可达成 92% 以上的召回率。检索过程中还引入交叉编码器实现的神经重排序技术,对初步检索结果进行相关性评分优化,确保前 5 条结果的准确率提升 40%。
系统创新性地集成 HyDE(假设文档嵌入)查询扩展技术,通过生成假设性答案来重构查询向量,有效解决术语不匹配问题。实测表明,对于专业文档的复杂查询,该技术能将平均精度提高 35%。所有检索组件均经过 GPU 加速优化,在 16GB 内存设备上可实现毫秒级响应。
本答案来源于文章《DeepSeek-RAG-Chatbot:本地运行的 DeepSeek RAG 聊天机器人》