KGGenを使って知識グラフを生成する手順は以下の通り:
1.入力テキストの準備
プレーンテキストファイル(例えばinput.txt)、内容の例:
人工智能正在改变世界。机器学习是人工智能的核心技术。斯坦福大学的研究团队开发了许多创新工具。
2.コンバージョンオーダーの実行
プロジェクト・ディレクトリで実行する:
python -m kg_gen --input input.txt --output graph.json
そのうちのひとつだ:
--inputテキストファイルのパスを指定する--output出力JSONファイルパスの定義
3.出力の解析
生成されたgraph.json構造化データ、例を含む:
{
"entities": ["人工智能", "机器学习", "斯坦福大学"],
"relations": [
{"source": "人工智能", "target": "机器学习", "relation": "包含"},
{"source": "斯坦福大学", "target": "创新工具", "relation": "开发"}
]
}
4.(オプション)高度な設定
- 修正
config.py言語モデルの切り替えやクラスタリングしきい値の調整 - バッチ処理は、シェルスクリプトを使って再帰的に呼び出すことができる。
- 増加
--verboseパラメータ デバッグ・ログを有効にする
ヒント:入力テキストの意味的な明確さはマッピングの品質に直接影響するので、最初に必要なデータクリーニングを行うことをお勧めします。
この答えは記事から得たものである。KG Gen:プレーンテキストからナレッジグラフを自動生成するオープンソースツールについて































