Installationsphase:
- Vorbereitung der UmweltPython 3.8+ und PyTorch 1.13.1+ (CUDA 11.7 GPU Umgebung empfohlen)
- Einrichtung::
pip install graphg(PyPI-Installation)
vielleichtgit cloneQuellcode späterpip install -r requirements.txt - API-KonfigurationEinstellung wichtiger Parameter wie SYNTHESIZER_MODEL in der .env-Datei
Operative Prozesse:
- Vorbereiten auf den EintrittErstellen von konformen Textdateien im JSONL-Format (siehe Ressourcen/Beispiele)
- Konfigurationsparametergraphgen_config.yaml bearbeiten, um Stichprobentiefe, Generierungsstil usw. festzulegen.
- Generation der Ausführung::
Befehlszeilenmethode:python -m graphg --config configs/graphgen_config.yaml
oder durchpython webui/app.pyStarten der Gradio-Visualisierungsoberfläche - Ausgabe erhaltenAnzeige der generierten JSONL-Q&A-Paare in dem in output_dir angegebenen Verzeichnis.
caveat: Der erste Lauf dauert 5-10 Minuten, um den Wissensgraphen zu initialisieren; GPU-Geräte können die Verarbeitung von Multi-Hop-Beziehungen beschleunigen; es wird empfohlen, die Umgebung zunächst mit Demodaten zu validieren.
Diese Antwort stammt aus dem ArtikelGraphGen: Feinabstimmung von Sprachmodellen mithilfe von Wissensgraphen zur Erzeugung synthetischer DatenDie































