使用KGGen生成知识图谱的步骤如下:
1. 准备输入文本
创建纯文本文件(如input.txt
),内容示例:
人工智能正在改变世界。机器学习是人工智能的核心技术。斯坦福大学的研究团队开发了许多创新工具。
2. 执行转换命令
在项目目录下运行:
python -m kg_gen --input input.txt --output graph.json
其中:
--input
:指定文本文件路径--output
:定义输出JSON文件路径
3. 解析输出结果
生成的graph.json
包含结构化数据,示例:
{ "entities": ["人工智能", "机器学习", "斯坦福大学"], "relations": [ {"source": "人工智能", "target": "机器学习", "relation": "包含"}, {"source": "斯坦福大学", "target": "创新工具", "relation": "开发"} ] }
4. (可选)高级配置
- 修改
config.py
切换语言模型或调整聚类阈值 - 批量处理可使用Shell脚本循环调用
- 添加
--verbose
参数启用调试日志
提示:输入文本的语义清晰度直接影响图谱质量,建议先进行必要的数据清洗。
本答案来源于文章《KG Gen:从纯文本中自动生成知识图谱的开源工具》