Die Trainingsdaten des Modells enthalten über 2 Millionen mehrsprachige Dokumentbeispiele mit speziell verbesserter Unterstützung für 39 ressourcenarme Sprachen wie Tibetisch und Suaheli. Durch sprachübergreifendes migratorisches Lernen und adversariales Training ohne zusätzliche Annotationsdaten wird die Erkennungsgenauigkeit für kleine Sprachen im Vergleich zu herkömmlichen OCR-Systemen um durchschnittlich 47% verbessert. Tests zeigen, dass das System die typografische Struktur und den Inhalt nicht-lateinischer Schriften auch dann korrekt erkennen kann, wenn der Benutzer nur englische Stichwörter angibt, was für die Verarbeitung grenzüberschreitender Geschäftsdokumente und mehrsprachiger Archive von großem Wert ist.
Diese Antwort stammt aus dem Artikeldots.ocr: ein vereinheitlichtes visuell-linguistisches Modell für die Analyse von mehrsprachigem DokumentenlayoutDie