技术原理差异
GraphGen采用知识蒸馏+主动学习范式,将源知识编译为结构化图谱后生成训练数据,实现模型参数层面的知识固化。而RAG(检索增强生成)依赖外部数据库实时检索,保持模型参数不变。
性能特征对比
- 响应速度:RAG适合实时查询,GraphGen需前置训练但推理时无额外延迟
- 知识更新:RAG修改知识库即可更新,GraphGen需重新微调模型
- 知识内化:GraphGen能支持复杂推理(如多跳问答),RAG受限于检索片段质量
典型应用场景
GraphGen更适合:
– 对推理深度要求高的场景(如学术知识问答)
– 网络条件受限环境(如端侧部署)
– 需要风格一致性的输出(如品牌客服话术)
而RAG擅长处理高频更新知识(如股市行情)和海量参考文档场景。
最佳实践建议将两者结合:用GraphGen构建基础能力,RAG处理动态信息。
本答案来源于文章《GraphGen:利用知识图谱生成合成数据微调语言模型》