GraphGen ist ein Open-Source-Framework, das von OpenScienceLab, einem KI-Labor in Shanghai, entwickelt wurde. Es konzentriert sich auf die Erzeugung synthetischer Daten zur Optimierung der überwachten Feinabstimmung von Large Language Models (LLMs) durch Wissensgraphen. Zu seinen Hauptfunktionen gehören:
- Feinkörnige Konstruktion von WissensgraphenExtrahieren von Entitäten und Beziehungen aus dem Ausgangstext, um eine strukturierte Wissensrepräsentation zu erstellen
- Wissen über die Erkennung des toten Winkels:: Verwendung von Metriken für den erwarteten Kalibrierungsfehler (ECE), um Schwachstellen im Modellwissen aufzuspüren
- Intelligente DatengenerierungAutomatische Generierung hochwertiger Q&A-Paare für identifizierte Wissenslücken (insbesondere Long-Tail-Wissen).
- Erfassung komplexer Beziehungen: Unterstützung von Multi-Hop-Nachbarschaftsproben zum Erlernen von mehrstufigen Assoziationen in Wissensgraphen
- Stilistische Vielfalt OutputSteuerung zur Erstellung kurzer oder ausführlicher Fragen und Antworten für verschiedene Szenarien
Das Projekt ist unter Apache 2.0 lizenziert und bietet sowohl eine Kommandozeilen- als auch eine visuelle Schnittstelle und erzeugt synthetische Daten, die direkt für das LLM-Training verwendet werden können.
Diese Antwort stammt aus dem ArtikelGraphGen: Feinabstimmung von Sprachmodellen mithilfe von Wissensgraphen zur Erzeugung synthetischer DatenDie































