安装阶段:
- 環境準備:Python 3.8+和PyTorch 1.13.1+(建议CUDA 11.7 GPU环境)
- インストール::
pip install graphg
(PyPI安装)
もしかしたらgit clone
源码后pip install -r requirements.txt
- API設定:在.env文件设置SYNTHESIZER_MODEL等关键参数
業務プロセス:
- 入場の準備:制作符合要求的JSONL格式文本文件(参考resources/examples)
- 設定パラメータ:编辑graphgen_config.yaml设置采样深度、生成风格等
- 実行生成::
コマンドライン方式:python -m graphg --config configs/graphgen_config.yaml
或通过python webui/app.py
启动Gradio可视化界面 - 获取输出:在output_dir指定目录查看生成的JSONL格式问答对
ほら:首次运行需5-10分钟初始化知识图谱;GPU设备可加速多跳关系处理;建议从demo数据开始验证环境。
この答えは記事から得たものである。GraphGen: 知識グラフを使って言語モデルを微調整し、合成データを生成するについて