Mehrsprachiges Bearbeitungsprogramm
LocalPdfChatRAG unterstützt die Interoperabilität von 18 Sprachen durch die folgende Architektur:
- automatische ErkennungFasttext-Spracherkennungsmodul wird verwendet, um die Sprache des Dokuments zu bestimmen (Genauigkeit 98,7%)
- dynamisches RoutingAutomatische Umschaltung des Modells paraphrase-multilingual-mpnet-base-v2 je nach Sprache
- gemischte AusgabeDie ursprüngliche Terminologie kann bei der Erstellung der Antwort unübersetzt bleiben (z. B. bei Rechtstexten).
Verfahren zur Konfiguration::
- Zusätzliche Abhängigkeiten installieren: pip install fasttext langdetect
- Ändern Sie den Parameter language_policy in config.yaml
- Für CJK-Sprachen wie CJK müssen Sie zusätzlich den Tokenizer-Parameter festlegen.
typische AnwendungEin multinationales pharmazeutisches Unternehmen nutzte die Lösung, um englisch-japanisch-deutsche klinische Berichte zu verarbeiten, und die Genauigkeit der Fragen und Antworten war um 62% besser als bei der Google Translate+ Suchlösung.
Diese Antwort stammt aus dem ArtikelLocalPdfChatRAG: Intelligentes Chat-Tool zur Unterstützung lokaler Fragen zu PDF-Dokumenten mit mehreren QuellenDie































