search_answer.yamlist das Kernprofil, das das Abrufverhalten von Medical-RAG steuert und in den folgenden Szenarien angepasst werden muss:
Abstimmung des Abrufeffekts
- GewichtungWenn die Ergebnisse einer bestimmten Suchmethode (dicht/dünn) nicht zufriedenstellend sind, ändern Sie die
weight_denseim Gesang antwortenweight_sparseStrategie zum Abrufen von Parametern mit Neugewichtung - Quantitative Kontrolle der Ergebnisse: durch
top_k_denseim Gesang antwortentop_k_sparseÄndern Sie die Anzahl der von jedem Kanal zurückgegebenen Ergebnisse
Anpassung des Geschäftsszenarios
- Fachanfragen-OptimierungKonfigurieren Sie differenzierte Suchschwellen für verschiedene Abteilungen (z. B. Medizin/Chirurgie)
- Handhabung von AbfragetypenEinstellung spezifischer Parameter für verschiedene Arten von Fragen, wie z. B. die Abfrage von Symptomen, die Beratung über Medikamente usw.
Anforderungen an die Systemintegration
- ModellwechselWenn das eingebettete Modell oder LLM geändert wird, muss es synchron aktualisiert werden.
embedding_configVerwandte Konfigurationen - Leistungsoptimierung: Geändert je nach Server-Ressourcen
batch_sizeOptimierung des Durchsatzes durch Parameter wie
Es ist nicht erforderlich, die Daten nach einer Änderung der Konfiguration erneut einzugeben, das System wendet die neue Richtlinie bei der nächsten Abfrage automatisch an. Es wird empfohlen, diepython scripts/search_pipline.py --search-configum einen interaktiven Test durchzuführen, um die Auswirkungen zu überprüfen.
Diese Antwort stammt aus dem ArtikelMedical-RAG: Ein Retrieval-Augmented Generation Framework für die Konstruktion chinesischer medizinischer Q&AsDie































