Stapelverarbeitung von Bildungsprüfungsunterlagen
Die folgenden standardisierten Verfahren werden für die Digitalisierung von Schulunterlagen empfohlen:
- Stapeleingabe::
- einrichten.
input_exams/Katalog zum Speichern von PDF/Bildern - ausnutzen
--input_dir input_exams/ --batch_size 10Parameter
- einrichten.
- Modul-Konfiguration::
- Mathematische Frage:
--mode math --latex_version amsmath - Experimentelle Karten:
--mode figure --figure_detail high - Antwortschlüssel:
--mode table --table_type answer_sheet
- Mathematische Frage:
- Output-Management::
- erhöhen.
--output_dir by_subject/ --file_prefix 2024midterm_ - .
--compress gzipGeringerer Speicherplatz
- erhöhen.
Praktisches Beispiel: Ein Gymnasium hat 300 Biologie-Fragen über dasparallel --jobs 4 python ocr_stage1.pyDurch die parallele Verarbeitung von 4 Prozessen konnte die benötigte Zeit von 8 Stunden auf 2,5 Stunden reduziert werden.
Diese Antwort stammt aus dem ArtikelVOP: OCR-Tool zum Extrahieren komplexer Diagramme und mathematischer FormelnDie
































