Hintergrund des Themas
Die Genauigkeit von Retrieval Augmented Generation (RAG)-Systemen ist oft durch einen einzigen Suchpfad und eine statische Wissensbasis begrenzt. SimpleDeepSearcher verbessert die Modellleistung durch dynamische Suche und Mehrrunden-Inferenzmechanismen erheblich.
Wichtige Technologieprogramme
- Architektur der Mehrrundenüberlegungen:
- Entwurf eines geschlossenen Kreislaufs für die Überprüfung von Suchergebnissen
- Unterstützt bis zu 5 Runden von Suchiterationen
- Automatisches Aufzeichnen des Entscheidungspfads für jede Suche
- Integration der Echtzeitsuche:
- Konfigurieren von GOOGLE_SUBSCRIPTION_KEY für den Zugriff auf die neuesten Daten
- Dynamische Anpassung der Suchstrategie und der Schlüsselwortkombinationen
- Unterstützt die Bewertung der Relevanz von Suchergebnissen
- Beaufsichtigung der Feinabstimmung der Optimierung:
- Training von Inferenzmodellen mit ausgewählten Daten
- Konfigurieren Sie sft_config.json, um die geeignete Lernrate einzustellen (empfohlen 2e-5)
- Beschleunigte Konvergenz durch Training mit gemischter Präzision
bestes Verfahren
- Bevorzugt werden Grundmodelle im Maßstab 32B und darüber
- Sicherstellen, dass die Such-API ≥ 5 Ergebnisse liefert
- Einstellung eines angemessenen Parameters für die Inferenztemperatur (0,7-1,0 empfohlen)
Diese Antwort stammt aus dem ArtikelSimpleDeepSearcher: Ein intelligentes Retrieval-Tool zur Verbesserung großer Sprachmodelle durch WebsucheDie































