As etapas para gerar um gráfico de conhecimento usando o KGGen são as seguintes:
1. preparação do texto de entrada
Crie um arquivo de texto simples (por exemploinput.txt), exemplos de conteúdo:
人工智能正在改变世界。机器学习是人工智能的核心技术。斯坦福大学的研究团队开发了许多创新工具。
2. execução de ordens de conversão
Execute-o no diretório do projeto:
python -m kg_gen --input input.txt --output graph.json
Entre eles:
--inputEspecifique o caminho para o arquivo de texto--outputCaminho do arquivo JSON de saída: define o caminho do arquivo JSON de saída
3. analisando a saída
geradograph.jsonContém dados estruturados, exemplos:
{
"entities": ["人工智能", "机器学习", "斯坦福大学"],
"relations": [
{"source": "人工智能", "target": "机器学习", "relation": "包含"},
{"source": "斯坦福大学", "target": "创新工具", "relation": "开发"}
]
}
4. (Opcional) Configuração avançada
- modificações
config.pyTroca de modelos de linguagem ou ajuste dos limites de agrupamento - O processamento em lote pode ser chamado recursivamente usando um script de shell
- aumentar
--verboseParâmetro Enable Debug Logging (Ativar registro de depuração)
Dica: a clareza semântica do texto de entrada afeta diretamente a qualidade do mapeamento, e é recomendável realizar primeiro a limpeza de dados necessária.
Essa resposta foi extraída do artigoKG Gen: uma ferramenta de código aberto para geração automática de gráficos de conhecimento a partir de texto simplesO































