dots.ocrの多言語サポートには2つの特筆すべき特徴がある:
- 低リソース言語の最適化チベット語やその他の資源が乏しい言語でも高い精度を維持できるような特別な学習戦略を採用し、従来のOCRツールでは小さな言語を十分にサポートできないという問題を解決しています。
- ハイブリッド文書処理同一文書内の多言語コンテンツ(英語と中国語の混在した契約書など)を、事前に言語タイプを指定することなく自動認識。
- 文化的適応の分析異なる言語(例えばアラビア語の右から左への組版)に対して、自動的に読み順出力を最適化します。
特に、東南アジアやアフリカなどの地域言語のカバー率を強化した100言語の学習データに基づいており、実際のテストでは、低資源言語の認識精度が汎用OCRツールよりも23%程度高いことが示されている。
この答えは記事から得たものである。dots.ocr: 多言語文書レイアウト解析のための統一された視覚言語モデルについて