完整工作流程
- 数据准备阶段:
- 将文档存放在指定目录(支持PDF/DOCX/TXT等格式)
- 调用
load_from_local_files(paths_or_directory="your_path")加载
- 向量化处理:
- 系统自动选择嵌入模型将文本转为向量
- 在Milvus中建立分片索引
- 查询执行阶段:
- 使用
query()方法提交自然语言问题 - 系统先检索相关文档段落,再调用LLM生成答案
- 使用
高级技巧
- 可通过
set_top_k(5)控制返回结果数量 - 使用
enable_hybrid_search=True开启混合检索模式 - 通过
set_response_mode("detailed")获取带参考文献的详细回答
典型应用
适用于合同条款查询、技术文档检索、客服知识库等场景,平均响应时间<800ms。
本答案来源于文章《Deep Searcher:企业私有文档高效检索与智能问答》




























