Die Qualität des RAGLight-Abrufs kann durch drei Dimensionen verbessert werden:
- ParametrisierungVergrößerung
k
Werte (z. B. 8-10) können mehr Dokumentfragmente abrufen, erhöhen aber den Zeitaufwand für die Berechnungen. Es wird empfohlen, mit k=5 zu beginnen, um Schritt für Schritt zu testen - Auswahl des Modus::
- .
RAT模式
passieren (eine Rechnung oder Inspektion etc.)reflection
Parameter (empfohlene Werte 2-3) fügen reflektierende Schritte hinzu, um die logische Strenge zu verbessern - Adoption
Agentic RAG
(in Form eines Nominalausdrucks)max_steps
Parameter für die Optimierung der Mehrrunden-Suche
- .
- Modelle einbetten: Ersetzen Sie das Standard-Vektormodell durch
all-MiniLM-L6-v2
Hochwertige Optionen wieVectorStoreConfig
angegeben inembedding_model
im Gesang antwortenprovider=Settings.HUGGINGFACE
Hinweis: Bei der Auswahl des Modells sollte die Hardwareleistung berücksichtigt werden; große eingebettete Modelle können den Speicherverbrauch erheblich erhöhen.
Diese Antwort stammt aus dem ArtikelRAGLight: Leichtgewichtige Python-Bibliothek zur Generierung von AbruferweiterungenDie