Vier Maßnahmen sind erforderlich, um Halluzinationen in akademischen Szenarien zu reduzieren:
- RAT-Modus einschalten: durch
RATPipeline
konfigurieren.reasoning_model_name="deepseek-r1:1.5b"
im Gesang antwortenreflection=2
Verbesserte Faktenüberprüfung - Kennzeichnung der Quelle: in
RAGPipeline
Bei der Initialisierung eingestelltreturn_sources=True
Bei der Ausgabe wird der Standort der Referenzen mit angegeben. - Reinigung von DokumentenEntfernen von Nicht-Text-Inhalten (z. B. Kopf- und Fußzeilen) bei der Vorverarbeitung von PDF-Dateien, um Störgeräusche zu reduzieren.
- Parameterabstimmung::
- aufstocken
k=7
Erhalten Sie mehr unterstützendes Material - Einstellung der LLM's
temperature=0.3
Reduzierte Zufälligkeit
- aufstocken
Es wird empfohlen, manuelle Stichproben der wichtigsten Ergebnisse durchzuführen und einen Mechanismus zur Bewertung der Genauigkeit einzurichten, der eine kontinuierliche Optimierung ermöglicht.
Diese Antwort stammt aus dem ArtikelRAGLight: Leichtgewichtige Python-Bibliothek zur Generierung von AbruferweiterungenDie