Terminologie Enhancement Programme verstehen
Wenn das Modell auf Begriffe stößt, die nicht in der Wissensbasis enthalten sind, kann dies in einem fünfstufigen Prozess behandelt werden:
- Begriffserfassung: durch
monitor_unanswered.py
Skriptprotokollierung von unbekannten Terminologieanforderungen - Auto-ErweiterungKonfigurieren von Azure OpenAI für
gen_synthetic_data.py
Automatische Generierung von Terminologieerklärungen - semantische Anpassung: Lauf
train_synonym.py
Abgleich der Terminologie mit dem vorhandenen Wissen - einen geschlossenen Kreislauf zu validieren: Neue Begriffe hinzufügen zu
pending_review.json
Inventarisiert nach manueller Überprüfung - Aktives Lernen: Freigeben
active_learning
Muster zum Sammeln von Nutzerfeedback
Die Umsetzungsdaten eines Legal-Tech-Unternehmens zeigen, dass das Modell dank der Lösung viermal schneller an die neu in Kraft getretene Rechtsterminologie angepasst werden konnte, und zwar umsemantic_fallback
Der Mechanismus verbessert die Genauigkeit der Antworten für nicht registrierte Begriffe von einer zufälligen Schätzung auf 72%. Es wird empfohlen, eine wöchentliche Überprüfung des Thesaurus durchzuführen (check_terminology_coverage
).
Diese Antwort stammt aus dem ArtikelKBLaM: Ein erweitertes Open-Source-Tool zur Einbettung von externem Wissen in große ModelleDie