Konfigurierbares Terminologieverwaltungssystem
Für technische Dokumente, akademische Kurse und andere professionelle Inhalte hat KrillinAI ein regelbasiertes Termersetzungssystem entwickelt. Der Arbeitsablauf des Systems umfasst:
- Vorladungsphase: Erstellung der Terminologiezuordnungstabelle über die Konfigurationsdatei config.toml
- Verarbeitungsphase: Einfügen des Terminologie-Ersatzmoduls in die Übersetzungspipeline
- Validierungsphase: Verwendung eines Prüfalgorithmus, um sicherzustellen, dass die Ersetzung von Begriffen die syntaktische Struktur des Satzes nicht beeinträchtigt
Praktische Beispiele zeigen, dass das System bei der Übersetzung medizinischer Videos "CT" genau in "Computertomographie" umwandeln und die Verwendung von Artikeln (z. B. a/an im Englischen) automatisch anpassen kann. Die Entwickler verwendeten einen Zwei-Wege-Matching-Algorithmus:
- Beim Vorwärtsabgleich werden vollständige Begriffe bevorzugt (z. B. "KI-Modell" → "Modell der künstlichen Intelligenz").
- Reverse Matching zur Behandlung von Wurzeländerungen (z. B. "models" → "modelling")
Die Funktion unterstützt die Konfiguration regulärer Ausdrücke, um komplexere Ersetzungsregeln zu handhaben. Das System erkennt standardmäßig mehr als 200 hochfrequente Begriffe aus dem Bereich Wissenschaft und Technik, die vom Benutzer durch benutzerdefinierte Wörterbücher unendlich erweitert werden können.
Diese Antwort stammt aus dem ArtikelKrillinAIDie