教育試験用紙の一括処理
学校書類のデジタル化のニーズに対しては、以下の標準化されたプロセスを推奨する:
- 一括入力::
- 確立
input_exams/PDF/画像を保存するカタログ - 利用する
--input_dir input_exams/ --batch_size 10パラメトリック
- 確立
- モジュール構成::
- 数学の問題:
--mode math --latex_version amsmath - 実験チャート:
--mode figure --figure_detail high - アンサー・キー
--mode table --table_type answer_sheet
- 数学の問題:
- 出力管理::
- 増加
--output_dir by_subject/ --file_prefix 2024midterm_ - 使い始める
--compress gzip収納スペースの削減
- 増加
実際の例:ある高校が生物学の問題集を300冊処理した。parallel --jobs 4 python ocr_stage1.py4工程の並列処理を実現し、所要時間を8時間から2.5時間に短縮した。
この答えは記事から得たものである。VOP: 複雑な図や数式を抽出するOCRツールについて
































