Technische Umsetzung und Anwendung von intelligentem Document Parsing
Die Dokumenten-Engine von Chatly verwendet eine hybride Architektur aus OCR- und T5-Modellen, die ein tiefgreifendes Parsing von 12 Formaten wie PDF, Word und anderen unterstützt. Wenn ein Anwalt einen 200-seitigen Vertrag hochlädt, führt das System eine verteilte Verarbeitung in der Cloud durch: In der ersten Stufe werden Text und Strukturelemente (Klauselnummern/Unterschriftsblöcke) extrahiert, in der zweiten Stufe werden wichtige Rechtsbegriffe (z. B. "Vertraulichkeitsklauseln", "Vertragsbruch") durch einen Aufmerksamkeitsmechanismus identifiziert, und schließlich wird eine interaktive Zusammenfassung mit Hyperlinks erstellt. Die zweite Stufe identifiziert wichtige Rechtsbegriffe (z.B. "Vertraulichkeitsklauseln", "Vertragsbruch") durch einen Aufmerksamkeitsmechanismus und erstellt schließlich eine interaktive Zusammenfassung mit Hyperlinks. Tests haben gezeigt, dass dieses Verfahren die Zeit für die Vertragsprüfung von 8 Stunden auf 30 Minuten verkürzen kann.
Die Anwendung im Bildungsbereich ist ebenso bemerkenswert: Nachdem Studenten akademische Arbeiten hochgeladen haben, kann die KI nicht nur automatisch eine Liste von Referenzen erstellen, sondern auch verwandte Theorien durch den Wissensgraphen miteinander in Beziehung setzen. Aus dem technischen Whitepaper geht hervor, dass die Erkennungsgenauigkeit der Tabelle 98,7% beträgt und damit weit über der von professionellen Tools wie Adobe Extract liegt. Für die Sicherheit wird eine Ende-zu-Ende-Verschlüsselung verwendet, und bei sensiblen Dokumenten werden die Originaldateien 72 Stunden nach der Analyse automatisch vernichtet.
Diese Antwort stammt aus dem ArtikelChatly: Intelligentes Chat- und Content-Generierungs-Tool mit Integration mehrerer KI-ModelleDie