使用KGGen生成知识图谱的步骤如下:
1. 准备输入文本
创建纯文本文件(如input.txt),内容示例:
人工智能正在改变世界。机器学习是人工智能的核心技术。斯坦福大学的研究团队开发了许多创新工具。
2. 执行转换命令
在项目目录下运行:
python -m kg_gen --input input.txt --output graph.json
其中:
--input:指定文本文件路径--output:定义输出JSON文件路径
3. 解析输出结果
生成的graph.json包含结构化数据,示例:
{
"entities": ["人工智能", "机器学习", "斯坦福大学"],
"relations": [
{"source": "人工智能", "target": "机器学习", "relation": "包含"},
{"source": "斯坦福大学", "target": "创新工具", "relation": "开发"}
]
}
4. (可选)高级配置
- 修改
config.py切换语言模型或调整聚类阈值 - 批量处理可使用Shell脚本循环调用
- 添加
--verbose参数启用调试日志
提示:输入文本的语义清晰度直接影响图谱质量,建议先进行必要的数据清洗。
本答案来源于文章《KG Gen:从纯文本中自动生成知识图谱的开源工具》































