如何解决RAG系统生成的回答中存在的幻觉问题？

2025-08-30

1.3 K

Background to the issue

RAG（检索增强生成）系统虽然能结合外部知识生成回答，但常因检索内容与生成不匹配产生幻觉（hallucination），即回答包含未被上下文支持的虚构信息。这种问题会降低系统可靠性，影响用户体验。

使用 LettuceDetect 工具可高效解决该问题，具体步骤如下：

mounting tool：通过 pip 安装包（pip install lettucedetect），选择 ModernBERT-base 或 ModernBERT-large 模型
输入三元组：传入上下文（context）、问题（question）和待检测回答（answer），注意总 token 不超过 4096
选择检测模式::
- span级检测：快速定位整段幻觉内容（输出起止位置+置信度）
- token级检测：逐词分析错误点（输出每个token的幻觉概率）
analysis：根据置信度（接近1表示高概率幻觉）优化RAG系统的检索或生成模块