Analyse von Leistungsengpässen
Die Konvertierungsgeschwindigkeit wird hauptsächlich von der CPU/GPU-Leistung, der Anzahl der PDF-Seiten und der Komplexität des Bildes beeinflusst. Benchmark-Tests zeigen, dass eine normale CPU etwa 3-5 Minuten für die Verarbeitung von 10 Seiten benötigt.
Programm beschleunigen
- Hardware-BeschleunigungModifikation
device="cuda:0"NVIDIA GPU aktiviert (CUDA-Treiber erforderlich) - StapeldateiBei Katalog-PDFs mit mehreren Kapiteln empfiehlt es sich, die Dateien nach der Konvertierung zusammenzuführen.
- Parametrisierung: Einstellungen
extract()(in Form eines Nominalausdrucks)skip_images=TrueÜberspringbare Bildverarbeitung
Fortgeschrittene Techniken
- Linux-Systeme können hinzufügen
OMP_NUM_THREADS=4Umgebungsvariable zur Steuerung der Anzahl von Threads - Das Modell ist nach dem Laden speicherresident und eignet sich für die Verwendung mit
while TrueKontinuierliche Schleifenverarbeitung mehrerer Dateien - Es wird empfohlen, übergroße Dateien (>50MB) zuerst zu verwenden.
pdfseparateWerkzeugspaltung
Diese Antwort stammt aus dem ArtikelPDF Craft: Gescannte PDF-Dokumente in Markdown umwandeln Open-Source-ToolsDie































