降低学术场景中的幻觉需采取4项措施:
- 启用RAT模式:通过
RATPipeline
配置reasoning_model_name="deepseek-r1:1.5b"
和reflection=2
增强事实校验 - 来源标注:在
RAGPipeline
初始化时设置return_sources=True
,输出结果将附带参考文献位置 - 文档清洗:预处理PDF时移除非正文内容(如页眉页脚),减少噪声干扰
- 参数调优:
- 提高
k=7
获取更多佐证材料 - 设置LLM的
temperature=0.3
降低随机性
- 提高
建议对关键结论实施人工抽样检查,建立准确率评估机制持续优化。
本答案来源于文章《RAGLight:轻量级检索增强生成Python库》