使用KGGen生成知识图谱的步骤如下:
1. preparação do texto de entrada
创建纯文本文件(如input.txt
), exemplos de conteúdo:
人工智能正在改变世界。机器学习是人工智能的核心技术。斯坦福大学的研究团队开发了许多创新工具。
2. 执行转换命令
Execute-o no diretório do projeto:
python -m kg_gen --input input.txt --output graph.json
Entre eles:
--input
:指定文本文件路径--output
:定义输出JSON文件路径
3. 解析输出结果
geradograph.json
包含结构化数据,示例:
{ "entities": ["人工智能", "机器学习", "斯坦福大学"], "relations": [ {"source": "人工智能", "target": "机器学习", "relation": "包含"}, {"source": "斯坦福大学", "target": "创新工具", "relation": "开发"} ] }
4. (可选)高级配置
- modificações
config.py
切换语言模型或调整聚类阈值 - 批量处理可使用Shell脚本循环调用
- aumentar
--verbose
参数启用调试日志
提示:输入文本的语义清晰度直接影响图谱质量,建议先进行必要的数据清洗。
Essa resposta foi extraída do artigoKG Gen: uma ferramenta de código aberto para geração automática de gráficos de conhecimento a partir de texto simplesO