项目集成的 GraphRAG 模块突破传统 RAG 的片段检索局限,构建文档实体知识图谱实现深度语义理解。该系统在上传文档处理阶段自动识别命名实体(如人物/组织/地点),并建立共现关系网络,形成包含数百个节点的语义图谱。当处理类似”A 公司董事会成员与 B 项目的关联性”这类复杂查询时,图谱分析能比纯文本检索准确率提升 60%。
技术实现上采用 Neo4j 图数据库存储三元组关系,配合 GNN 算法进行关系推理。具体应用场景包括合同条款关联分析、学术论文引用网络挖掘等。测试数据显示,对于包含 50 页以上的长文档,GraphRAG 可使问答系统对隐含关系的识别能力提高 3 倍。