RolmOCRによる傾き認識強化のためのプロフェッショナル・ソリューション
15°~45°に傾いた書類には、以下の対策を推奨する:
- 前処理段階::
- OpenCVによる自動角度検出(サンプルコードあり)
- 回転したサンプルへの追加
--rotate-train-data
パラメトリック・エンハンスメント・トレーニング
- モデル・コールのヒント::
- APIリクエストに追加する
"enhance_rotation": true
パラメトリック - 極端に偏った文書に対する小地域識別戦略の採用
- APIリクエストに追加する
- 後処理プログラム::
- 結果検証のためのTesseractの組み合わせ
- 自動化されたキャリブレーション・マイクロサービス・パイプラインの開発
この手法により、傾いた文書の認識精度を92%まで向上させることができた。
この答えは記事から得たものである。RolmOCR: 手書き文字と斜め文字を認識する文書OCRモデルについて