Medical-RAG的混合检索系统采用双通道并行检索+智能融合的设计理念,包含以下核心组件:
检索通道
- 稠密向量检索::
- 支持多种嵌入模型:包括本地部署的bge-m3、OpenAI API或HuggingFace模型
- 基于Milvus实现高性能近似最近邻搜索(ANN)
- 擅长捕捉语义相关性,适用于复杂症状描述等场景
- 稀疏向量检索::
- 采用BM25算法进行关键词匹配
- 通过医疗领域专用词表(vocab.pkl.gz)提升术语识别精度
- 适合处理药品名称、疾病代码等精确匹配需求
结果融合层
提供两种融合策略:
- RRF融合:基于 Reciprocal Rank Fusion算法动态调整结果排序
- 加权融合: By
search_answer.yaml
配置文件自定义各通道权重比例
该架构通过LangChain框架实现流程编排,最终将优化后的检索结果传递给生成模型构建答案。
This answer comes from the articleMedical-RAG: A Retrieval-Augmented Generation Framework for Constructing Chinese Medical Q&AsThe