Terminologie Enhancement Programme verstehen
Wenn das Modell auf Begriffe stößt, die nicht in der Wissensbasis enthalten sind, kann dies in einem fünfstufigen Prozess behandelt werden:
- Begriffserfassung: durch
monitor_unanswered.pySkriptprotokollierung von unbekannten Terminologieanforderungen - Auto-ErweiterungKonfigurieren von Azure OpenAI für
gen_synthetic_data.pyAutomatische Generierung von Terminologieerklärungen - semantische Anpassung: Lauf
train_synonym.pyAbgleich der Terminologie mit dem vorhandenen Wissen - einen geschlossenen Kreislauf zu validieren: Neue Begriffe hinzufügen zu
pending_review.jsonInventarisiert nach manueller Überprüfung - Aktives Lernen: Freigeben
active_learningMuster zum Sammeln von Nutzerfeedback
Die Umsetzungsdaten eines Legal-Tech-Unternehmens zeigen, dass das Modell dank der Lösung viermal schneller an die neu in Kraft getretene Rechtsterminologie angepasst werden konnte, und zwar umsemantic_fallbackDer Mechanismus verbessert die Genauigkeit der Antworten für nicht registrierte Begriffe von einer zufälligen Schätzung auf 72%. Es wird empfohlen, eine wöchentliche Überprüfung des Thesaurus durchzuführen (check_terminology_coverage).
Diese Antwort stammt aus dem ArtikelKBLaM: Ein erweitertes Open-Source-Tool zur Einbettung von externem Wissen in große ModelleDie































